收藏Jiayuan @Tisoga 这篇RAG帖子有段时间了,今天结合https://t.co/eP0isvJwl2边学习边查询,被Jiayuan和devv圈粉了!
Jiayuan这个帖子不仅把复杂的事情讲的简单清晰,还有很多思想闪闪发光:
1)抓住本质,RAG系统本质就3个模块,其他都是在此之上增加步骤:语言模型、模型所需的外部知识合集、当前场景所需外部知识。推特上有很多RAG的帖子,流程图极为复杂,很不费曼~
2)先做工 VS 后做工:https://t.co/eP0isvJwl2 走的是先做工法则,在encoding时对原始knowledge数据做了大量处理。带来的好处是:更高准确性、更快检索速度、更好的关联性、更高的可理解性、更好的应用性。(来自devv搜索结果)
产品和技术方案中大部分事情,如果能遵循先做工原则,最后拿到好结果是水到渠成的事情。
看完先做工,再看后做工,有点像前面没好好做,后面打补丁的意思。
再说说https://t.co/eP0isvJwl2的使用体验,帖子中很多paper、专有名词和技术思路,我用perplexity和devv做了对比,经过三条信息查询后,就完全用devv来解决问题了。对比感受:
1)perplexity对中文不是很友好,冷不丁就是英文回复。devv中文回复比较稳定、质量高且suggest追问也挺有帮助。
2)perplexity的来源和devv比也有些差距,perplexity对中文问题搜中文来源比如新浪、163。devv的来源有arxiv、medium、reddit……很合我胃口~~
3)UI对比,工具属性的视角和问答还不太一样,很关注信息源,perplexity在上面收成小卡片与答案压在一起。devv的信息源排列在右侧,舒展开,很舒适。
收获很大,强烈推荐体验一下这个帖子以及 https://t.co/eP0isvJwl2 🫡🫡🫡
点击图片查看原图