转译：一种全新的 RAG 方法让文档理解更上一层楼RAG 技术已经迅速成为在实际应用中部署大型语言模型（LLMs）的首选方式。但大部分现有技术仍面临一个局限：它们只能从文档中检索到一小段连续的文本，这限制了对整个文档上下文全面理解的能力。现有一种创新方法，名为…

发布时间: 2024-02-04 13:40:56

1分

数据加载中

2

1

0

转译：一种全新的 RAG 方法让文档理解更上一层楼
RAG 技术已经迅速成为在实际应用中部署大型语言模型（LLMs）的首选方式。但大部分现有技术仍面临一个局限：它们只能从文档中检索到一小段连续的文本，这限制了对整个文档上下文全面理解的能力。
现有一种创新方法，名为…
IT技术
( twitter.com )

4个月前由宝玉提交

转译：一种全新的 RAG 方法让文档理解更上一层楼

RAG 技术已经迅速成为在实际应用中部署大型语言模型（LLMs）的首选方式。但大部分现有技术仍面临一个局限：它们只能从文档中检索到一小段连续的文本，这限制了对整个文档上下文全面理解的能力。

现有一种创新方法，名为 RAPTOR（递归抽象处理树形组织检索），它通过递归地嵌入、聚类并总结文本段落，从底层到顶层构建出一个分层次总结的树状结构。

在使用这个模型进行推理时，RAPTOR 能够从这棵树中提取信息，实现对长文档不同层次抽象信息的整合。

通过实验对比，我们发现，相较于传统的检索增强语言模型，RAPTOR 通过递归总结的检索方式在多个任务上都取得了显著的进步。

特别是在需要复杂多步推理的问答任务中，结合 RAPTOR 的检索功能和 GPT-4 的强大能力，我们在 QuALITY 基准测试上的表现提高了20个百分点，达到了新的最佳水平。

未来，我们期待出现更多类似 RAPTOR 这样的方法，进一步深化对文档的理解并优化 RAG 技术。RAPTOR 的优势在于它专注于改善检索部分，而不是像其他方法那样，通过添加噪声或引入网络搜索结果来调整上下文。

论文：https://t.co/u7FAGyeeqC

点击图片查看原图

评论加载中...

您可能感兴趣的：更多

1

2

1

1

翻译了两篇 RAG（检索增强生成相关的文章）：
《检索增强生成（RAG）：从理论到 LangChain 实践 | Retrieval-Augmented Generation (RAG): From Theory to LangChain Implementation》
原文：
译文：
《12 种调整策略指南：为生产环境打造高效的…
IT技术
( twitter.com)

6个月前 • 宝玉 • -- 点击 0 评论

2

2

1

1

强烈推荐这篇：《Advanced RAG Techniques: an Illustrated Overview》
不可多得的全面阐述 RAG 概念指南。
原文：
译文：
IT技术
( twitter.com)

5个月前 • 宝玉 • -- 点击 0 评论

3

2

1

1

转译：7 个帮助最小化 RAG 模型风险的指标
今天我们要学习如何使用关键指标评估 RAG。…
IT技术
( twitter.com)

1个月前 • 宝玉 • -- 点击 • 下载视频 0 评论

00:08:32

4

2

1

1

前几天我发了一个Claude的提示工程师给出的五个提示词的书写建议的视频，他最后提议去看 Claude 的文档。
我去看了一下文档里面还有很多更详细的技巧也比较成体系，所以这里就翻译整理了一下。
通过翻译和学习这个文档我对之前不太理解的一些提示词概念也有了更深的理解。…
IT技术
( twitter.com)

9个月前 • 歸藏 • -- 点击 0 评论

5

2

1

1

超长上下文 LLM 与 RAG 技术，在文档问答场景下谁更强？我动手做了一个对比实验
结论：大模型长上下文对 RAG 技术就是降维打击。不期望大模型都达到 200K、2M 这种级别的上下文长度，但至少应该达到 32K、64K 的长度且保证模型质量不下降。长上下文可以极大的简化 RAG…
时政
( twitter.com)

2个月前 • heycc • -- 点击 0 评论

6

2

1

1

#工程师学习发现一篇 PDF 原理解析的文章，PDF Explained 的非官方中文翻译版，假如你对这种文件格式感兴趣，可以通过它聊入门了解。
🤖
IT技术
( zxyle.github.io)

4个月前 • Tw93 • -- 点击 0 评论

7

2

1

1

OpenAI分享他们在RAG技术的最佳实践：
客户需求：他们有大量文档（比如10万份），希望模型只基于这些文档进行知识检索。
解决方案：
1. 直接将PDF和docx文件嵌入，准确率是45%。
2. 经过20次调优迭代，解决细节小Bug - 准确率到65%
3.
时政
( twitter.com)

12天前 • Y11 • -- 点击 0 评论

8

2

1

1

之前存过，可以尽快把钱取出来了。
看了一下官方发的文档，aztec大概的逻辑是要转型，想深入了解的可以去看看文档：
取款地址：…
币圈
( twitter.com)

1年前 • sanyi.eth / 🦇🔊 • -- 点击 0 评论

9

2

1

1

“北京正成为世界的思想首都。”这句话的中文翻译成英语可以有多种方式，具体的选择取决于上下文和强调的重点。以下是三种可能的翻译方式及其语法解析：
1. "Beijing is emerging as the global capital of ideas."
-…
时政
( twitter.com)

8个月前 • Petrichor • -- 点击 0 评论