什么是 RAG?RAG 的主要流程是什么?
回答重点
RAG(Retrieval Augmented Generation,检索增强生成)是一种结合信息检索和生成式模型的技术方案。其主要流程包括两个核心环节:
- 检索(Retrieval):基于用户的输入,从外部知识库中检索与查询相关的文本片段,通常使用向量化表示和向量数据库进行语义匹配;
- 生成(Generation):将用户查询与检索到的内容作为上下文输入给生成模型(如 GPT 等),由模型输出最终答案。
就是在本地检索到相关的内容,将其增强到提示词中,再去做结果生成。
简单来说,就是利用外部知识动态补充模型生成能力,既能保证回答的准确性,又能在知识库更新时即时反映最新信息(部分业务是内部文档,网上没有,因此可以本地提供知识库来增强AI的知识)。
扩展知识
为什么会有RAG?
随着自然语言处理技术的发展,纯生成模型虽然可以生成流畅的文本,但有时知识会滞后或不够准确。通过引入检索模块,RAG 模型能够从外部知识库中提取实时且丰富的信息,再经过生成模型综合处理,提升回答的准确性和覆盖面,而无需重新训练模型。
RAG的详细工作流程
- 文本向量化
a. 使用语义模型将文档和问题转为高维向量表示 - 检索阶段
a. 在向量数据库中检索与查询最相似的 N 条内容 - 构建 prompt
a. 将用户原始问题和检索到的内容拼接拼接为模型上下文输入