把这篇论文翻译了一下：《退一步，看得更远：通过抽象引发大型语言模型中的推理》Take a Step Back: Evoking Reasoning via Abstraction in Large Language Models什么是退一步提示法？…

发布时间: 2023-10-27 12:41:01

1分

数据加载中

把这篇论文翻译了一下：
《退一步，看得更远：通过抽象引发大型语言模型中的推理》Take a Step Back: Evoking Reasoning via Abstraction in Large Language Models

什么是退一步提示法？…
IT技术
( baoyu.io )

把这篇论文翻译了一下：
《退一步，看得更远：通过抽象引发大型语言模型中的推理》Take a Step Back: Evoking Reasoning via Abstraction in Large Language Models
https://t.co/deedtBho8r

什么是退一步提示法？

退一步提示这个方法的灵感来自于一个观察：很多任务都很复杂，充满了细节，让大语言模型（LLMs）很难找到解决问题所需的相关信息。比如在图 2 的第一个例子中，一个关于物理的问题：“如果一个理想气体的温度翻了一番，体积增加了八倍，那么它的压强 P 会发生什么变化？”LLM 在直接解答这个问题时可能会忽略理想气体定律的基本原则。类似地，一个询问“Estella Leopold 在 1954 年 8 月到 11 月期间就读于哪所学校？”的问题，由于时间范围非常具体，直接回答也是非常困难的。在这两种情况下，通过退一步提问，我们能够帮助模型更有效地解决问题。

我们定义退一步问题为从原始问题中派生出来的、层级更高的抽象问题。比如，不直接问“Estella Leopold 在特定时间段内的学校是哪所”，我们可以问一个更高层次的问题：“Estella Leopold 的教育历史是怎样的？”（如图 2 下方所示）。通过回答这个更抽象的问题，我们能获得解答原始问题所需的所有信息。通常来说，退一步问题比原始问题更容易回答。基于这种抽象层次的推理有助于避免中间步骤的错误，就像图 2 中左侧的链式思维提示的例子一样。总的来说，退一步提示包含两个简单的步骤：

1. 抽象：我们首先提示 LLM 提出一个关于更高层次概念或原则的通用问题，并检索与之相关的信息，而不是直接回答原始问题。
2. 推理：在获取了关于高层次概念或原则的信息后，LLM 可以基于这些信息对原始问题进行推理。我们将这种方法称为基于抽象的推理。
在接下来的部分，我们将展示在一系列复杂的 STEM、知识问答和多步推理任务上对退一步提示方法的实证研究。

点击图片查看原图

Markdown支持

评论加载中...

您可能感兴趣的：更多

这篇已经有人翻译成中文了，但是第5章之后的似乎没有人翻译，有感兴趣的可以试试接着把后面的第6章翻译一下，这章实践性、价值都非常高，更值得翻译。中译文：
推特中文圈
( twitter.com)

2年前 • plantegg • -- 点击 0 评论

昨天的一篇论文《Dissecting In-Context Learning of Translations in GPTs | 深入分析 GPTs 在机器翻译中的上下文学习》主要提供了两个有价值的信息：
1. 使用LLM（大语言模型）翻译时，上下文对翻译质量影响很大。…
IT技术
( twitter.com)

2年前 • 宝玉 • -- 点击 0 评论

这篇文章对比了Claude、GPT和Gemini的机器翻译能力。
在不刻意Prompt Enginee情况下，猜哪个更强？
字面翻译
ChatGPT 和 Gemini 在翻译“Leading the pack”和“know a thing or two”时，采用了字面翻译，在日语中听起来不自然。Claude 则进行了意译，翻译结果更自然。
IT技术
( www.science.co.jp)

1年前 • 向阳乔木 • -- 点击 0 评论

能根据上下文翻译单词的 APP
设计思路很有意思，你先给外文拍照，然后看似你像普通划词翻译一样点一个生词，（我猜）其实 APP 背后用 AI 把全文翻译一遍、再根据上下文告诉你它在此处的意思，很巧妙地解决了多义词的问题，翻译结果更准👏
我拍照测试了一下，它理解了 Fallout…
IT技术
( twitter.com)

1年前 • 倪爽 • -- 点击 0 评论

《GPT-4V，多模态大模型的黎明》。这篇论文是在国庆假期期间出来的，正好大家都在游山玩水，所以这篇论文的关注度并不高。实际这是下半年，也是在 GPT5 出来之前最值得关注的内容，这里对论文进行一些内容精选与翻译，特别是对示例内容也加了翻译和说明。
IT技术
( blog.orangesai.com)

2年前 • orange.ai • -- 点击 0 评论

tailscale 这篇讲 NAT 穿透的文章太有意思了！我一直以为得要穿透NAT必须要有中继服务器才行，醍醐灌顶啊
英文原文特别长，也可以看这篇中文翻译：
推特中文圈
( twitter.com)

2年前 • Josh • -- 点击 0 评论

一译，看论文神器，上传论文，帮你翻译，并且可以左右两栏中英对照查看
时政
( yiyibooks.cn)

1年前 • 哥飞 • -- 点击 0 评论

GPT-4 ，人类迈向AGI的第一步（上半）
文章节选+翻译了本月最重要的一篇论文的内容
该论文是一篇长达154页的对 GPT-4 的测试。微软在很早期就接触到了 GPT-4 的非多模态版本，并进行了详尽的测试。
论文不管是测试方…
推特中文圈
( twitter.com)

2年前 • orange.ai • -- 点击 0 评论

【我在海外学中文，没能用母语碾压外国人】一段文言文，我得用英语把它翻译得信达雅。一篇有关中国古代艺术的论文，对我而言是长达四五十页的英文阅读理解。
大陆资讯
( mp.weixin.qq.com)

1年前 • 欲念此功必先自宫 • -- 点击 0 评论

闪电预览

把这篇论文翻译了一下： 《退一步，看得更远：通过抽象引发大型语言模型中的推理》Take a Step Back: Evoking Reasoning via Abstraction in Large Language Models 什么是退一步提示法？… IT技术 ( baoyu.io )

IT技术

这篇已经有人翻译成中文了，但是第5章之后的似乎没有人翻译，有感兴趣的可以试试接着把后面的第6章翻译一下，这章实践性、价值都非常高，更值得翻译。中译文： 推特中文圈 ( twitter.com)

推特中文圈

昨天的一篇论文《Dissecting In-Context Learning of Translations in GPTs | 深入分析 GPTs 在机器翻译中的上下文学习》主要提供了两个有价值的信息： 1. 使用LLM（大语言模型）翻译时，上下文对翻译质量影响很大。… IT技术 ( twitter.com)

IT技术

IT技术

IT技术

IT技术

tailscale 这篇讲 NAT 穿透的文章太有意思了！我一直以为得要穿透NAT必须要有中继服务器才行，醍醐灌顶啊 英文原文特别长，也可以看这篇中文翻译： 推特中文圈 ( twitter.com)

推特中文圈

一译，看论文神器，上传论文，帮你翻译，并且可以左右两栏中英对照查看 时政 ( yiyibooks.cn)

时政

推特中文圈

【我在海外学中文，没能用母语碾压外国人】一段文言文，我得用英语把它翻译得信达雅。一篇有关中国古代艺术的论文，对我而言是长达四五十页的英文阅读理解。 大陆资讯 ( mp.weixin.qq.com)

大陆资讯

创建一个新帐户

登录

把这篇论文翻译了一下：
《退一步，看得更远：通过抽象引发大型语言模型中的推理》Take a Step Back: Evoking Reasoning via Abstraction in Large Language Models

什么是退一步提示法？…
IT技术
( baoyu.io )

这篇已经有人翻译成中文了，但是第5章之后的似乎没有人翻译，有感兴趣的可以试试接着把后面的第6章翻译一下，这章实践性、价值都非常高，更值得翻译。中译文：
推特中文圈
( twitter.com)

昨天的一篇论文《Dissecting In-Context Learning of Translations in GPTs | 深入分析 GPTs 在机器翻译中的上下文学习》主要提供了两个有价值的信息：
1. 使用LLM（大语言模型）翻译时，上下文对翻译质量影响很大。…
IT技术
( twitter.com)

tailscale 这篇讲 NAT 穿透的文章太有意思了！我一直以为得要穿透NAT必须要有中继服务器才行，醍醐灌顶啊
英文原文特别长，也可以看这篇中文翻译：
推特中文圈
( twitter.com)

一译，看论文神器，上传论文，帮你翻译，并且可以左右两栏中英对照查看
时政
( yiyibooks.cn)

【我在海外学中文，没能用母语碾压外国人】一段文言文，我得用英语把它翻译得信达雅。一篇有关中国古代艺术的论文，对我而言是长达四五十页的英文阅读理解。
大陆资讯
( mp.weixin.qq.com)