interesting-AI

AI的逻辑推理

前几天看到一个逻辑题

如果昨天是明天就好了,那么今天就是周五了。请问句子中的今天是周几
这个问题很有意思,我第一反应是今天是周三,我没有聚焦在昨天而是聚焦在其中的逻辑当中,就是如果昨天是明天,此时的明天是今天的明天,我将这个今天的明天当成一个具体的星期数,也就是星期四,那么也就是说,昨天是周四的话,今天就是星期五。可实际上今天是星期三

然后我的朋友给我的回答是今天是星期日,“星期日”怎么来的?我感到很疑惑,然后仔细想想,如果把昨天是明天这句话的明天当成周五的明天,也是就是说是周六,那么今天不就是周五嘛,此时实际上昨天是周六,那么实际上今天是周日

可能我说的也是很绕口,但是归因下来就是看你如何将一个含糊的昨天当成周几了
然后下面的标准答案,我觉得更能让人理解

如果昨天是明天就好了,那么今天就是周五了。请问今天实际是周几?

  • 答案一:【昨天周二,今天周三,明天周四】潜台词: “哎,今天怎么才周三啊,如果昨天不是周二,而是周四就好了,这样今天就是周五了,周末马上就要开始了。”(下意识把抽象的“明天”替换成了具体的周四 )

  • 答案二:【昨天周六,今天周日,明天周一】潜台词: “哎,今天周日这么快就要过去了啊,如果周六不是在昨天,而是在明天就好了,这样今天才周五,周末才刚要开始。”(下意识把抽象的"昨天”替换成了具体的周六)这么读起来,似乎周三和周日两种答案都对。

    但实际上,读着没问题,是因为采用了“不是…而是”的表达方式,替换以后的句子是符合大家的表达信息与接受信息的习惯的,是一个没有歧义的、把特定值赋予抽象值的过程

此时你可能感到奇怪了,这和AI的逻辑推理有什么关系,时间来到今天下午,我突然想到哎,如果是AI来回答这种问题,它能答上来吗?
在日常生活中,我们对AI的使用越来越频繁,但是我们很少去问AI逻辑推理问题,于是说试就试,我一共找来了六种大模型,包含市面上的最强大的几款,先说结果吧,只有一个大模型回答正确,就是Chat-gpt4o

模型 回答
Chat-gpt4o 假设今天是X天。根据题意:“如果昨天是明天就好了,那么今天就是周五了。” 我们分析以下几点: 昨天是明天。 今天是周五。我们从今天是周五出发,逆推一下: 如果今天是周五,那么昨天是周四。如果昨天是周四,但题目中说“昨天是明天”,这意味着周四其实是明天所以,今天实际是周三。总结:今天是周三。
Kimi 这个逻辑谜题可以通过以下步骤来解决:假设今天是周五。昨天就是周四。明天就是周六。现在,让我们根据句子中的逻辑来分析:句子说:“如果昨天是明天就好了”,这意味着我们希望昨天(周四)是明天。但是,根据正常的周次顺序,昨天不可能是明天。句子接着说:“那么今天就是周五了”,这暗示了如果我们按照句子中的条件(昨天是明天),今天(原本是周四)就会变成周五。所以,如果我们接受句子中的条件,那么今天实际上是周四。因为句子中的逻辑是在说,如果昨天(周四)是明天,那么今天(原本是周四)就会是周五。但现实中,昨天不可能是明天,所以今天仍然是周四。
智谱清言 这个问题实际上是一个逻辑谜题。首先,我们需要理解句子中的条件:“如果昨天是明天就好了”。这句话意味着如果昨天(通常是周四)实际上是明天(通常是周六),那么今天就会是周日。但是,由于这是一个假设,我们需要找到符合这个假设的实际日期。如果昨天是明天,那么今天实际上是在假设中的“明天”的前一天,即周五。然而,由于我们知道这个假设是不真实的,我们需要找到符合这个假设的真实日期。因此,如果今天是周五,那么昨天实际上是周四,而明天是周六。但是,我们需要将这个逻辑倒转回来,因为原句是一个未实现的愿望。所以,如果昨天是明天,那么今天实际上是在假设中的“明天”的前一天,即周五。现在,我们知道今天实际上是周五的“前一天”,即周四。但是,由于这是一个假设,我们需要再次倒转逻辑。如果昨天是明天,那么今天实际上是在假设中的“明天”的前一天,即周五。然而,由于我们知道这个假设是不真实的,我们需要找到符合这个假设的真实日期。因此,如果今天是周五,那么昨天实际上是周四,而明天是周六。但是,我们需要将这个逻辑倒转回来,因为原句是一个未实现的愿望。所以,如果昨天是明天,那么今天实际上是在假设中的“明天”的前一天,即周五。 现在,我们知道今天实际上是周五的“前一天”,即周四。但是,由于这是一个假设,我们需要再次倒转逻辑。如果昨天是明天,那么今天实际上是在假设中的“明天”的前一天,即周五。最终,我们可以得出结论,如果昨天是明天,那么今天实际上是在假设中的“明天”的前一天,即周五。因此,今天的实际日期是周五。
Claude-3 根据这个句子的逻辑: 如果昨天是明天就好了 那么今天就是周五了 这意味着,如果昨天是明天的话,那么今天就应该是周五。 但是,这只是一个假设性的情况。实际上,今天是什么具体的星期几,这个句子并没有明确说明。所以,我们无法确定句子中所说的"今天"到底是周几,因为这只是一个假设性的情况,并没有给出实际的今天是哪一天。
Mistral 抱歉,我无法理解你想表达什么。如果你问今天是星期几,我可以回答,但是我不能理解你的话语中的逻辑。根据常识,今天是星期日。
零一万物 这个句子是一个逻辑谜题,我们可以这样分析:  如果昨天是明天,那么今天就是昨天和明天之间的日子,即今天就是昨天和明天的中间一天。 如果今天是周五,那么昨天是周四,明天是周六。但是根据句子的假设,昨天是明天,所以周四就是周六,这是不可能的,因为周四和周六不是同一天。因此,我们需要找到一个日子,它的前一天是它的后一天的前一天。这样的日子只能是周五,因为周五的前一天是周四,后一天是周六。所以,如果昨天是明天,那么今天只能是周五。根据这个逻辑,句子中的“今天”是周五。
Chat-gpt3.5 如果我们根据题目假设“如果昨天是明天就好了,那么今天就是周五了”,我们可以逆推一下:如果今天是周五,那么昨天应该是周四。但是根据题目,“如果昨天是明天”,那么昨天应该是周五。所以,这个假设存在矛盾,无法成立。因此,无法确定今天实际是周几。

看到结果,就是很想笑,有些AI不知道就不回答,有些AI利用自己的逻辑推理,一本正经的胡说八道,但是这个小实验也是存在很多问题的,它们的数据集参差不齐,对其推理的结果会有很大的影响,不过这也可以说明,一般的AI对于逻辑推理能力是个弱项,Chat-gpt4o之所以能回答出来,就是它的参数足够大,能力足够强(刚发布能不强吗)

但其实这些还不是AI的全部实力,我是完全基于没有提示词来询问的,如果你先给出AI的提示词,就比如:你现在是一名逻辑推理大师,下面有个问题想问你,请你给出回答。 有一个先决条件,AI会回答的很好,自己去试试吧 (笔者试过)

人工智能会超过人类吗,我觉得是可以的,两年时间,大模型如雨后春笋般冒出,在使用中我们也是看到了AI的实力的进步,就比如前几天的Open AI 和 Google 发布的新模型,给世人带来了新的震撼,从AI对话到AI生图,到去年的视频模型以及附带的一系列AI工具,以及如今的AI实时互动,AI已经与我们密不可分,其带来的能力也让我们受益无穷,我们必须学会使用AI也要学会利用AI,减少自己的工作流程,形成自己的工作流,减轻自己的工作量,AI再怎么强大,也是为人类服务的


interesting-AI
http://example.com/2024/05/19/intertsting-AI/
作者
max
发布于
2024年5月19日
许可协议