AI Agent开发第69课-彻底消除RAG知识库幻觉(3)-手撕“重排序”
开篇
大模型充满了幻觉,因为必竟它不是人类有长久记忆,大模型在处理语言任务上表现出色,但它们在达到人类智力方面存在显著局限。它必须通过人类输入知识、无法通过自身实践获得知识。人之所以为人,是因为“创新”。而大模型只能重复。这就会导致在以RAG为基础的AI Agent里大模型充满了幻觉。在上几篇“彻底消除 RAG知识库幻觉”系列中我们提到了这么一个公式:你的搜索内容必须>=用户的提问。要求召回率越大、越多越好。但是这依然不能解决大模型的“过度拟合”问题。因为当喂给大模型的知识库条目内容越多,大模型反而越回答了不好,它会回答一些不相关的内容甚至是“张冠李戴”,因此今天我们要讲在RAG里当召回率高、数据量大时如何把回答的范围“缩”到尽量贴近用户的提问范围内的技巧,这就是“重排序”,又称为Re-ranking。
什么是重排序(Re-ranking)
重排序(Re-ranking)技术在检索增强生成(Retrieval Augmented Generation,RAG&#