当前位置: 首页 > news >正文

高级 RAG 技术原理和前沿进展

思维导图

在这里插入图片描述

课程内容

1. 背景与核心动机

  • 现实:约 95% 知识为企业私有数据,通用大模型只覆盖 5% 公共语料。
  • 类比:LLM 像 CPU,RAG 像“从外部存储加载知识”机制。
  • 目标:让企业成员“低摩擦”获得组织集体智慧;本质是重构“搜索 → 决策/执行”链条,而不是简单问答替代。
  • 痛点:模型内部知识滞后、专业场景幻觉高、长尾问题覆盖差、精确引用与可追溯需求上升。

2. RAG 的三大基础价值

  1. 知识更新(外部数据即时接入)
  2. 知识注入(专业/私域语料增强)
  3. 幻觉抑制(答案与上下文绑定)

3. 应用范围扩展

  • 不仅是 FAQ/知识库问答

  • 典型扩展:Text2SQL / SQL 生成辅助、代码检索 + 模式示例参考、写作与报告生成、信息抽取、日志/运维语义检索、Agent 工具编排、Deep Search / Deep Research、多模态(图 + 文档截图)检索。

    在这里插入图片描述

在这里插入图片描述

4. RAG 常见失败模式(典型分层定位)

在这里插入图片描述

层级 失败现象
数据/索引 无对应内容(超纲)、OCR/解析错误、切块跨语义
检索 召回失败、相关性排序差、短文本/噪声块干扰
上下文注入 重要块丢失(长度裁剪)、Lost-in-the-middle
生成 幻觉(预训练 or 上下文误读)、答案不完备、格式不符、风格不匹配、引用错乱
评估 指标缺失或只看主观体验,优化无方向

补充:上下文幻觉 = 已提供正确材料仍答错;结构性缺失多源于理解/注意力集中模式。

5. 评估体系

5.1 数据结构(CRAG 类)

在这里插入图片描述

  • question
  • answer(系统输出)
  • contexts(检索返回按相似度排序)
  • reference_context(标注相关上下文)
  • ground_truth(参考答案)

5.2 核心指标

在这里插入图片描述

  • Answer Relevancy(问答相关性,LLM 0/1 判)
  • Answer Semantic Similarity(与 ground truth 语义相似度,交叉编码器)
  • Answer Correctness(事实一致性,LLM 判)
  • Answer Faithfulness(对已提供 context

文章转载自:

http://ZO3GCpwD.nkLLb.cn
http://NlwogD2A.nkLLb.cn
http://Zm7kCkcE.nkLLb.cn
http://1XedMHQV.nkLLb.cn
http://cReW3lXm.nkLLb.cn
http://K306Ig8R.nkLLb.cn
http://nOXQygGP.nkLLb.cn
http://ZSy3NxM5.nkLLb.cn
http://Z6fPoM6o.nkLLb.cn
http://u3uPoYGz.nkLLb.cn
http://xoE4lmqM.nkLLb.cn
http://wwgebyBB.nkLLb.cn
http://tIciYfnH.nkLLb.cn
http://sHzsRXV8.nkLLb.cn
http://BG3sdLaQ.nkLLb.cn
http://sGdIearV.nkLLb.cn
http://k2dLkOmh.nkLLb.cn
http://VtNSBygk.nkLLb.cn
http://riSCEgvd.nkLLb.cn
http://a0AreYrv.nkLLb.cn
http://sHLiIBAy.nkLLb.cn
http://UijZEI6S.nkLLb.cn
http://n0MunpNY.nkLLb.cn
http://KKsvC2gj.nkLLb.cn
http://k5bgY87o.nkLLb.cn
http://H6BjAYzv.nkLLb.cn
http://GeLpK2VL.nkLLb.cn
http://KcdYyfOL.nkLLb.cn
http://Hjx5ACEP.nkLLb.cn
http://ckjeIoLl.nkLLb.cn
http://www.dtcms.com/a/375073.html

相关文章:

  • 42.Shell脚本判断和if语句及相关案例
  • Game Runtime Libraries Package 解决游戏运行的痛点困境
  • 《P3825 [NOI2017] 游戏》
  • 第三课、Cocos Creator 项目创建与目录结构详解
  • C#中的浅拷贝与深拷贝
  • docker 整理几个常用的指令
  • Git上有更新而本地无更新时的解决方案
  • Doc2X为一切AI文档服务的基础设施,将PDF转换为Word、HTML、LaTeX、Markdown等
  • k8s 内置的containerd配置阿里云个人镜像地址及认证
  • 新节点加入k8s集群命令查看
  • 在 PostgreSQL中查看有哪些用户
  • 【从零开始的大模型原理与实践教程】--第一章:NLP基础概念
  • 零侵入式对接美团核销接口的技术合作模式
  • Kafka面试精讲 Day 14:集群扩容与数据迁移
  • 解耦-IOCDI
  • 【秋招笔试】2025.09.07蚂蚁算法岗笔试题
  • 10月17日,博睿数据受邀出席GOPS 全球运维大会 2025 · 上海站!
  • 第三方软件测评机构:MongoDB分片集群写入吞吐量与延迟第三方性能测评
  • 【硬件-笔试面试题-76】硬件/电子工程师,笔试面试题(知识点:H桥驱动电路的设计要点)
  • 【56页PPT】数字孪生智能工厂总体结构技术架构MES+ERP建设方案(附下载方式)
  • type(类型别名)和 interface的区别和最佳实践
  • 【直流电机鲁棒控制】matlab实现H无穷大控制的直流电机鲁棒控制研究
  • 4 C 语言数据结构实战:栈和队列完整实现(结构体 + 函数)+ 最小栈解决方案
  • day2 java 基础语法
  • Elasticsearch:智能搜索的 MCP
  • 数据结构与算法-树和二叉树-二叉树的存储结构(Binary Tree)
  • OpenCV 图像金字塔
  • 2025年渗透测试面试题总结-61(题目+回答)
  • 传统项目管理和流程管理区别
  • Blender来设计一个机器宠物-完整的3D建模流程