LLM的信息记忆交互是个非常值得研究的课题。虽然Langchain在持续不断抽象解决这个问题，但可能还需要一定时间才能做的更好。以下是我自己的一些认识：1、滚动窗口，设定一个滚动窗口，LLM记的住窗口内部的内容，这种更像是一种缓存机制…

发布时间: 2024-01-22 01:50:15

1分

数据加载中

LLM的信息记忆交互是个非常值得研究的课题。
虽然Langchain在持续不断抽象解决这个问题，但可能还需要一定时间才能做的更好。
以下是我自己的一些认识：
1、滚动窗口，设定一个滚动窗口，LLM记的住窗口内部的内容，这种更像是一种缓存机制…
时政
( twitter.com )

LLM的信息记忆交互是个非常值得研究的课题。
虽然Langchain在持续不断抽象解决这个问题，但可能还需要一定时间才能做的更好。

以下是我自己的一些认识：
1、滚动窗口，设定一个滚动窗口，LLM记的住窗口内部的内容，这种更像是一种缓存机制
2、对历史对话不断总结，比如针对Q1A1-Q2A2....做summary，但信息会有折损
3、对消息进行外部存储，通过提问和上下文做召回，将召回内容返回给LLM的对话窗口以便使用
这种工程化作业就很多了，用矢量库的，或者redis的，各种各样。多半知识库也是利用这个
4、还有很多有意思的工程，比如replika设定的mark，可以让用户主动标记某个消息，如用户的生日，构成外部优先级比较高的存储信息

目前从整体方法上讲虽然就这些，但实际上的使用要区分场景和实施细节，结果会完全不一样。

比如一条信息，到底是以实体的方式存储维护，还是单单是一个单纯的文本，亦或是构建成知识图谱三元组？这些往往要因场景和预期效果而定。对token消耗，响应时间，召回效果上做不可能三角的平衡，用到的Langchain的方法也不太一样（比如下图）

这里有一个将Langchain翻译过的中文站，之前看过一些，感觉工程上还是有非常非常多细节的。
https://t.co/aL8Cvd70Pu

点击图片查看原图

Markdown支持

评论加载中...

您可能感兴趣的：更多

Open AI传奇研究员Andrej Karpathy的新课，教你理解和构建GPT Tokenizer。
他可以把相当复杂的LLM概念用非常好理解的方式讲出来。希望了解LLM的强烈建议听一下他的课，包括一些历史课程。
用GPT-4翻译了一下这节课，感兴趣可以听一下。字幕文件下载和历史课程会放在下面⬇️
IT技术
( twitter.com)

1年前 • 歸藏 • -- 点击 • 下载视频 0 评论

02:13:34

LLM 由于缺少事实知识，会出现幻觉，也就是我们经常看到的胡说八道，对于这类问题的解决方案，比较常见的是引入外部知识，也就是先通过搜索匹配的方式，获取真实世界关联性比较强的信息，然后附带这些信息与 LLM 交互，从而提供准确性和可…
IT技术
( twitter.com)

2年前 • Barret李靖 • -- 点击 0 评论

提示工程是您获得 GPT-4 和 Llama-2 最佳效果的全部需要
一项新的研究介绍了 26 项提示原则，这些原则可将 LLM 的反应提高 50%
本研究涵盖提示结构和清晰度、具体性和信息以及复杂任务和编码提示等方面。（from
IT技术
( twitter.com)

1年前 • Will • -- 点击 0 评论

狠人 ‼️ 需要狠人👥把CryptoTalks订购的10个付费群的信息榨出汁😈😈😈

研究付费群的信息、时事热点，深挖价值所在，一起挑战每日盈利20%

🔔要求：
1⃣对信息有辨别能力
2⃣能交流
到碗里来Telegram：…
币圈
( twitter.com)

2年前 • CryptoTalks • -- 点击 0 评论

OpenAI的研发Lilian写的一篇关于AI Agents的blog挺不错的。
她将 Agents 定义为 LLM、记忆（Memory）、任务规划（Planning Skills）以及工具使用（Tool Use）的集合，其中 LLM 是核心大脑，Memory、Planning Skills 以及 Tool Use 等则是 Agents 系统实现的三个关键组件。
时政
( twitter.com)

2年前 • fuxiang • -- 点击 0 评论

先上车再研究 $NFTE

NFTE OP的NFT交易平台

目前流通量大概15% （1500万代币），市值非常小

开盘价格0.02 目前0.048 涨幅不大市值很低…
币圈
( twitter.com)

2年前 • 宝藏工厂24 • -- 点击 0 评论

时政

IT技术

IT技术

信息只有交换才会产生价值，越大规模的信息交换产生的价值越多。互联网如此，人际关系也是一样。
推特中文圈
( twitter.com)

推特中文圈

一篇介绍 LangChain 的短文：

这样5篇 mini 的小课，足够放进 ChatGPT 来总结。对我这样的非研究人员，更关心如何通过 LLM 放大自己的生产力。

所以就跟…
IT技术
( twitter.com)

IT技术

上海大众，我记忆中是一个非常大的工厂，是什么原因关闭的？
时政
( twitter.com)

时政

提示工程是您获得 GPT-4 和 Llama-2 最佳效果的全部需要
一项新的研究介绍了 26 项提示原则，这些原则可将 LLM 的反应提高 50%
本研究涵盖提示结构和清晰度、具体性和信息以及复杂任务和编码提示等方面。（from
IT技术
( twitter.com)

IT技术

狠人 ‼️ 需要狠人👥把CryptoTalks订购的10个付费群的信息榨出汁😈😈😈

研究付费群的信息、时事热点，深挖价值所在，一起挑战每日盈利20%

🔔要求：
1⃣对信息有辨别能力
2⃣能交流
到碗里来Telegram：…
币圈
( twitter.com)

币圈

时政

先上车再研究 $NFTE

NFTE OP的NFT交易平台

目前流通量大概15% （1500万代币），市值非常小

开盘价格0.02 目前0.048 涨幅不大市值很低…
币圈
( twitter.com)

币圈

时政

IT技术

IT技术

信息只有交换才会产生价值，越大规模的信息交换产生的价值越多。互联网如此，人际关系也是一样。 推特中文圈 ( twitter.com)

推特中文圈

一篇介绍 LangChain 的短文： 这样5篇 mini 的小课，足够放进 ChatGPT 来总结。对我这样的非研究人员，更关心如何通过 LLM 放大自己的生产力。 所以就跟… IT技术 ( twitter.com)

IT技术

上海大众，我记忆中是一个非常大的工厂，是什么原因关闭的？ 时政 ( twitter.com)

时政

提示工程是您获得 GPT-4 和 Llama-2 最佳效果的全部需要 一项新的研究介绍了 26 项提示原则，这些原则可将 LLM 的反应提高 50% 本研究涵盖提示结构和清晰度、具体性和信息以及复杂任务和编码提示等方面。（from IT技术 ( twitter.com)

IT技术

狠人 ‼️ 需要狠人👥把CryptoTalks订购的10个付费群的信息榨出汁😈😈😈 研究付费群的信息、时事热点，深挖价值所在，一起挑战每日盈利20% 🔔要求： 1⃣对信息有辨别能力 2⃣能交流 到碗里来Telegram：… 币圈 ( twitter.com)

币圈

时政

先上车再研究 $NFTE NFTE OP的NFT交易平台 目前流通量大概15% （1500万代币），市值非常小 开盘价格0.02 目前0.048 涨幅不大 市值很低… 币圈 ( twitter.com)

币圈

创建一个新帐户

登录

信息只有交换才会产生价值，越大规模的信息交换产生的价值越多。互联网如此，人际关系也是一样。
推特中文圈
( twitter.com)

一篇介绍 LangChain 的短文：

这样5篇 mini 的小课，足够放进 ChatGPT 来总结。对我这样的非研究人员，更关心如何通过 LLM 放大自己的生产力。

所以就跟…
IT技术
( twitter.com)

上海大众，我记忆中是一个非常大的工厂，是什么原因关闭的？
时政
( twitter.com)

提示工程是您获得 GPT-4 和 Llama-2 最佳效果的全部需要
一项新的研究介绍了 26 项提示原则，这些原则可将 LLM 的反应提高 50%
本研究涵盖提示结构和清晰度、具体性和信息以及复杂任务和编码提示等方面。（from
IT技术
( twitter.com)

狠人 ‼️ 需要狠人👥把CryptoTalks订购的10个付费群的信息榨出汁😈😈😈

研究付费群的信息、时事热点，深挖价值所在，一起挑战每日盈利20%

🔔要求：
1⃣对信息有辨别能力
2⃣能交流
到碗里来Telegram：…
币圈
( twitter.com)

先上车再研究 $NFTE

NFTE OP的NFT交易平台

目前流通量大概15% （1500万代币），市值非常小

开盘价格0.02 目前0.048 涨幅不大市值很低…
币圈
( twitter.com)