当前位置: 首页 > news >正文

【自然语言处理与大模型】RAG发展过程中的三个范式

        近年来,随着大语言模型(LLM)在自然语言处理领域的广泛应用,检索增强生成(RAG) 成为解决模型幻觉问题、提升回答准确性和事实一致性的重要技术手段。RAG通过结合外部知识库的检索能力与生成模型的强大表达能力,实现了信息获取与内容生成的深度融合。

RAG系统经历了三个主要发展阶段:

  1. 初级 RAG(Naive RAG)
  2. 高级 RAG(Advanced RAG)
  3. 模块化 RAG(Modular RAG)

一、Naive RAG

        初级 RAG 采用了一个传统过程,包括索引建立、文档检索和内容生成。简单来说,系统根据用户的输入查询相关文档,然后将这些文档和一个提示语结合起来,交给模型生成最终的回答。如果涉及到多轮对话,还可以将对话历史整合到提示语中。初级 RAG 是最基础的实现方式,其工作流程如下:

  1. 索引:将文档切分为片段并生成嵌入向量,存储于向量数据库中。
  2. 检索:根据用户查询,在向量空间中查找语义相似的文档片段。
  3. 增强:将检索结果拼接至提示模板中,形成输入。
  4. 生成:大语言模型基于提示生成最终答案。

优点:结构简单、易于部署,适用于静态知识问答场景。

缺点描述
低精确度检索返回的内容可能不完全相关,导致生成错误信息。
低召回率难以覆盖所有相关信息,尤其当查询复杂或多义时。
信息过时风险若知识库未及时更新,模型可能引用陈旧数据。
幻觉模型可能基于不完整或无关信息虚构答案。
冗余与重复多个相似文档被同时检索,造成内容重复。
风格不一致不同来源的文档风格差异大,影响输出连贯性。

二、Advanced RAG

        为克服初级 RAG 的缺陷,高级 RAG 引入了一系列端到端优化策略,聚焦于检索前(Pre-retrieval)、检索中(During retrieval)和检索后(Post-retrieval) 的全流程改进。

(1)检索前优化

  • Query Routing(查询路由):判断查询类型,选择合适的数据源或子系统。
  • Query Rewriting(查询改写):将原始查询转化为更具体、语义更明确的形式。
  • Query Expansion(查询扩展):添加同义词、相关概念等,提高召回率。

(2)检索过程优化

  • 嵌入模型微调(Fine-tuned Embedding Models):使用领域特定数据训练嵌入模型,提升语义匹配精度。
  • 动态嵌入(Dynamic Embeddings):如 OpenAI 的 embeddings-ada-02 支持上下文感知的编码。
  • 混合检索(Hybrid Search):结合关键词搜索(BM25)与语义搜索(向量检索),兼顾准确性与召回率

(3)检索后优化

  • 重排序(Re-ranking):对初步检索结果按相关性重新排序,常用方法包括 Cross-Encoder、ColBERT。
  • 摘要融合(Summary & Fusion)
    • 使用 LLM 对多个文档进行摘要合并;
    • 或采用 Maximal Marginal Relevance (MMR) 实现多样性与相关性的平衡。
  • 提示压缩(Prompt Compression):去除冗余文本,避免上下文窗口溢出。

三、Modular RAG

        模块化 RAG 是当前 RAG 架构发展的前沿方向,它将整个系统解耦为一系列可插拔、可组合的功能模块,从而实现高度灵活的任务适配。其核心理念是允许开发者根据任务需求自由组合不同功能模块,支持多种执行路径(patterns),满足多样化应用场景,各模块独立开发、测试与迭代。上图中的关键模块分类的解释如下表:

模块功能说明
Search执行实际的检索操作,支持多种检索算法。
Retrieve从数据库中提取候选文档片段。
Rewrite改写查询或文档以增强匹配效果。
Rerank对检索结果进行再排序。
Read解析文档内容,提取关键信息。
Fusion合并多个来源的信息,避免重复。
Memory存储对话历史或长期记忆,支持多轮交互。
Routing判断查询应由哪个子系统处理。
Predict基于已有信息预测答案或引导推理路径。
Demonstrate提供示例或思维链,辅助模型推理。

典型模式(patterns)

模式流程应用场景
Naive RAGRetrieve → Read简单问答系统
Advanced RAGRewrite → Retrieve → Rerank → Read高精度知识检索
DSP(Demonstration-based Prompting)Demonstrate → Search → Predict推理类任务
ITER-RETGENRetrieve → Read → Retrieve → Read复杂问题分步求解
http://www.dtcms.com/a/411131.html

相关文章:

  • 华为纯血鸿蒙系统怎么安装物联通
  • 基于 PyTorch 的 CIFAR-10 图像分类实践
  • 专业的新乡网站建设深圳企业网站建设专业
  • 旅游网站论文不让网站在手机怎么做
  • DeepSeek-V3.1最终版,DeepSeek-V3.1-Terminus来了!
  • 若依前后端分离版实现前端国际化步骤
  • 做游戏本测评的网站合肥建设局网站首页
  • PyTorch深度学习快速入门--B站小土堆笔记
  • 【论文阅读笔记】VeloCycle
  • OpenSpeedy简介
  • 【论文阅读 | IF 2025 | LFDT-Fusion:潜在特征引导的扩散 Transformer 模型在通用图像融合中的应用】
  • 网网站建设站建设做推广优化的网站有哪些
  • 企业建设网站个人总结网站内容与目录结构图
  • 软考中级习题与解答——第十三章_数据库分析与设计(1)
  • 2025 PHP7/8 实战入门:15 天精通现代 Web 开发——第 15 课:项目实战与部署
  • RNA甲基化技术如何选择?
  • 网站建设与运营实验上海环球金融中心
  • 高斯分布及其线性变换
  • silverlight做的网站英文网站做百度权重有意义吗
  • 宁波网站推广报价南京网站定制
  • Linux开发工具入门:零基础到熟练使用(二)
  • kafka-日志收集平台部署项目
  • 郑州建站推广公司太原市制作网站
  • 学习:uniapp全栈微信小程序vue3后台(28)
  • 如何提高网站流量公众号推广代理
  • 怎么自己做淘宝客网站吗.net响应式网站模板
  • AI投资决策Agent系列——沃伦·巴菲特Agent
  • 网站开发流程知乎深圳线上注册公司
  • PSG数据集概述
  • 《考研408数据结构》第二章《线性表(顺序表、链表)》复习笔记