之前分享了一系列关于 RAG 和生成式搜索引擎怎么做的文章(包括最近在中关村论坛也做了一个关于生成式搜索引擎的演讲)。最近 @jiayq @yadong_xie 团队的 Lepton Search 开源了,大家可以阅读一下源码,非常简洁,核心部分用了 500 行 Python 就实现了一个类似 Perplexity 的生成式搜索引擎。
https://t.co/Gy96eBMQRZ
https://t.co/jgjk1NmDE1 底层的 RAG 部分大概有 2 万行左右的 Go,我们依然 focus 在开发者这个细分的场景中,在 RAG 的每一步都做了非常多的优化。
扬清老师的一个观点我觉得非常对,RAG 的核心在 R 不在 G,这个应该做过 RAG 的都有体验。
And 如果未来我们把 https://t.co/jgjk1NmDE1 依赖的这套 Go 语言的 RAG framework 开源大家会感兴趣么,相比较 Python,我们测试下来可以以极少的资源来支持百万级别的搜索 RAG。