RAG混合检索:倒数秩融合RRF算法
文章目录
- 检索增强生成 (RAG)
- 倒数秩融合
- 在 RAG 中的工作原理
- RRF 背后的数学直觉

检索增强生成 (RAG)
RAG
是自然语言处理中的一种强大技术,结合了基于检索的模型和生成模型的优势。
如果检索器未能从检索器中获取相关文档,则精度较低,幻觉的可能性会增加。
有些查询适合基于关键字的检索技术,如 BM25
,而有些查询在密集检索方法中可能表现得更好,其中我们从语言模型嵌入了 embedding
。有混合技术可以解决这两种检索方法的缺点。
倒数秩融合
倒数排名融合是一种排名聚合方法,它将来自多个来源的排名组合成一个统一的排名。在 RAG
的上下文中,这些源通常使用不同的检索模型或方法。
- RRF 公式
RRF(d)