看到一篇对Kimi探索版的复杂逻辑推理测试很有意思。Kimi经过一系列假设验证，得到了正确结论。对大语言模型来说，需要借助CoT（思维链），生成分析过程。但是有思维链不代表就一定能做对，分别测试一下几个模型，GPT-4o 和 o1 都能做对，尤其是 o1，推理很严谨。让我意外的是 Claude

发布时间: 2024-10-11 13:30:27

2分

数据加载中

关注推特

收听电报

3

2

1

看到一篇对Kimi探索版的复杂逻辑推理测试很有意思。Kimi经过一系列假设验证，得到了正确结论。
对大语言模型来说，需要借助CoT（思维链），生成分析过程。但是有思维链不代表就一定能做对，分别测试一下几个模型，GPT-4o 和 o1 都能做对，尤其是 o1，推理很严谨。让我意外的是 Claude
IT技术
( twitter.com )

10个月前由宝玉提交

看到一篇对Kimi探索版的复杂逻辑推理测试很有意思。Kimi经过一系列假设验证，得到了正确结论。

对大语言模型来说，需要借助CoT（思维链），生成分析过程。但是有思维链不代表就一定能做对，分别测试一下几个模型，GPT-4o 和 o1 都能做对，尤其是 o1，推理很严谨。让我意外的是 Claude 试了三次一直做不对，过程都有，但是总的出错误的结论。豆包表现得有些不可思议，它竟然会想到先找出一对矛盾的说法，证明另外两个说法是真实的，然后直接得出结论，比Claude和Kimi的做法显得更聪明些。

有兴趣你也可以试试：
> 问: 某公司被窃,A、B、C、D四人涉嫌被拘留。侦破结果表明,罪犯就是其中的某一个人。A说:“是C偷的。”B说:“我没偷。”C说:“我也没偷。”D说:“如果B没有偷,那么就是我偷的。”现已查明,其中只有一个人说了假话,从上述条件可以确定，谁偷成立?

点击图片查看原图

点击图片查看原图

点击图片查看原图

点击图片查看原图

Markdown支持

评论加载中...

您可能感兴趣的：更多

1

3

2

2

强烈推荐这篇文章：《深入探索：AI 驱动的 PDF 布局检测引擎源代码解析 [译]》
系统的分析了最近很火的 PDF 转 Markdown 开源程序 Marker 的工作原理，比我想象的要复杂不少，用了好几个开源库。Marker 主要通过以下六个阶段来工作：
1. 准备阶段：利用 PyMuPDF…
IT技术
( github.com)

1年前 • 宝玉 • -- 点击 0 评论

2

2

1

1

OpenAI对GPT-4 Turbo进行优化，提高写作、数学、逻辑推理和代码能力，回复将更加直接，更少啰嗦。
时政
( twitter.com)

1年前 • 外汇交易员 • -- 点击 0 评论

3

2

1

1

18家AI搜索的测评结果已正式发布，你猜对了吗？
省流版：
第一轮的测试结果
0分组：豆包、秘塔AI、天工AI、文心一言、Bing、跃问、千问
1分组：万知、Gemini、
2分组：智谱、海螺、kimi、元宝、thinkany
3分组：Perplexity、ChatGPT、360 AI 搜索、百川
IT技术
( mp.weixin.qq.com)

1年前 • orange.ai • -- 点击 0 评论

4

2

1

1

No Kings全美游行，比起其他族裔，大家都看到了，华人参与的比例低得可怜……什么原因呢？反映了我们这个族群怎样的政治逻辑？而这套逻辑，对中国的转型，或者说，下一次的“改朝换代”方式，又有着怎样的提前预示？
说起原因，其实并不复杂。
时政
( twitter.com)

2个月前 • Eric.V 前特工/V字旅创建者 • -- 点击 • 下载视频 0 评论

00:00:29

5

2

1

1

今天，字节进行了年终的重磅发布，内容太多了，来划三个重点：
首先是豆包的视觉理解模型：
- 非常强的内容识别能力，能看到影子就判断是什么小动物
- 在图像信息的复杂逻辑计算方面也很强，大幅提升了数学题、图表解读、物理推理、代码推理等方面的能力
-
IT技术
( twitter.com)

8个月前 • orange.ai • -- 点击 0 评论

6

2

1

1

抖音网友揭秘苏式逻辑
中式逻辑就是苏式逻辑的翻版，但这两者都不是逻辑学范畴，而是意识形态诡辩术。
要进行正常逻辑思维必须首先撇开这套诡辩术的常用词汇。这就像真正的政治讨论必须首先清理掉网络用语：一个满嘴网络用语的人，不仅对政治一知半解，甚至对什么是现实也一样产生幻觉。
时政
( twitter.com)

28天前 • Ignatius Lee • -- 点击 • 下载视频 0 评论

00:02:45

7

5

4

4

逻辑对不代表你有道理！
时政
( twitter.com)

1年前 • ***土隹 • -- 点击 • 下载视频 0 评论

00:00:34

8

2

1

1

请看苏联逻辑、俄罗斯逻辑、普京逻辑、扎哈罗娃逻辑。
时政
( twitter.com)

8个月前 • Jacobson🌎🌸贴贴BOT • -- 点击 0 评论

9

3

2

2

张鹏：中国的学校为什么不开逻辑课？
理解了此文，也就理解了逻辑。
下面是我总结的一整套“逻辑交锋”对话。它不针对任何人或者任何组织。
故事场景为某学校召开的一次新闻发布会。到会的有本校老师、学生、家长以及媒体记者。回答问题的是学校校长。
1、提问：学校为什么不开逻辑课？
时政
( twitter.com)

1个月前 • 朱韵和 • -- 点击 0 评论

0.06652 Second , Gzip Enable.本网所有言论均来自网络，不代表本网站立场。联系方式: [email protected]

©2012.11.21 bad.news All rights reserved. 社区自动运营第 -- 年零 -- 天
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

关注推特