当前位置: 首页 > news >正文

Case-Based Reasoning用于RAG

rag系列文章目录

文章目录

  • rag系列文章目录
  • 前言
  • 一、CBR简介
  • 二、应用场景
  • 三、RAG和CBR
  • 总结


前言

在做大模型应用RAG的时候,会发现一种特殊的场景,就是基于之前的case进行回答,比如法律咨询、医疗诊断等等。这种情况的问答,需要有强有力的case支持才行,有了case支持,大模型回答会更加准确。


一、CBR简介

CBR这个概念已经很久了,它是一种人工智能推理方法,它的基本思想是:
遇到新问题时,先回忆相似的过去案例,再基于这些案例进行调整,得到新问题的解答。
• 关键步骤(通常被总结为 4R):

  1. Retrieve(检索):在案例库中找到与当前问题最相似的案例。
  2. Reuse(复用):借鉴案例的解决方案来应对当前问题。
  3. Revise(修正):对方案进行调整,使其更适合当前问题。
  4. Retain(保留):把新问题及解决方案存入案例库,供以后使用。

二、应用场景

CBR 在传统 AI 和现在的智能系统里都很有用,常见场景有:

• 医疗诊断:根据过往病例(案例)推理新病人的诊断和治疗方案。
• 法律咨询:检索相似案例判例,辅助新的法律推理。
• 技术支持/客服:根据历史工单问题,推荐解决方案。
• 教育领域:通过历史学生答题情况,给出个性化反馈。
• 工业故障诊断:借鉴历史设备故障案例,快速定位新故障原因。

三、RAG和CBR

RAG(Retrieval-Augmented Generation,检索增强生成)和 CBR 有相似之处:
• RAG:从知识库中检索文本片段,送入大模型作为上下文。
• CBR:从案例库中检索相似案例,借鉴其解决方案并调整。
在某种意义上,CBR 可以视为一种更结构化、更贴近应用的 RAG:
• RAG 偏重 “检索文档 → 辅助生成”。
• CBR 偏重 “检索案例 → 推理/调整解决方案”。

传统RAG,直接使用文本块作为知识,可能存在以下问题:

• 检索片段和问题语义不完全对齐;
• 模型无法直接借鉴完整的“解决方案”;
• 缺乏可复用的 经验逻辑。
而引入 CBR 可以提升:

  1. 检索粒度:直接检索“完整案例”(问题 + 解决方案),比单纯的知识点更贴近用户问题。
  2. 推理效率:模型可以基于过去“怎么解决”的完整上下文,快速类比,而不是从零生成。
  3. 可解释性:回答可以展示“参考案例”,让结果更可信。
  4. 持续学习:CBR 的 Retain 步骤可以不断积累新案例,相当于让 RAG 的库自动成长。

在论文中指出,使用CBR-RAG可以有效提高RAG问答准确率,其架构图如下:
在这里插入图片描述


总结

不仅在RAG中可以引入CBR,在agent中也可以引入CBR,比如在agent基于客户问题生成工作计划时,根据已有的案例生成工作计划,会更加可靠,防止大模型发散规划导致失败。


文章转载自:

http://j144KjN7.tqqfj.cn
http://0RRv0MHD.tqqfj.cn
http://7RBX7rPM.tqqfj.cn
http://VasJd9NX.tqqfj.cn
http://X2UwH61J.tqqfj.cn
http://oLu0Nfs7.tqqfj.cn
http://i3I5o82Z.tqqfj.cn
http://ldGMWyt2.tqqfj.cn
http://PwEcdUjp.tqqfj.cn
http://ngfgXmjt.tqqfj.cn
http://ZjKegioR.tqqfj.cn
http://qRzuQmKn.tqqfj.cn
http://MeOyIM4E.tqqfj.cn
http://u4m7kXhx.tqqfj.cn
http://98yC0rsd.tqqfj.cn
http://IOdoocUz.tqqfj.cn
http://f86vtKOC.tqqfj.cn
http://nmDB6D8h.tqqfj.cn
http://6agBQH58.tqqfj.cn
http://oN8Spxfb.tqqfj.cn
http://j83E8v5f.tqqfj.cn
http://pntEIQ7I.tqqfj.cn
http://qW63lPd3.tqqfj.cn
http://t8DbGp7T.tqqfj.cn
http://L2zOgwhZ.tqqfj.cn
http://PeHCIcCA.tqqfj.cn
http://7JZ3KlA6.tqqfj.cn
http://XNnO7cUs.tqqfj.cn
http://pjre6cvo.tqqfj.cn
http://6Od275Qf.tqqfj.cn
http://www.dtcms.com/a/382504.html

相关文章:

  • 如何通过标签和分类提升知识复用效率
  • 小红书笔记评论一键获取,实时查看作品数据
  • Day22 用C语言编译应用程序
  • 在RHEL9上使用通用二进制包部署mysql教程
  • 【Qt】QT Creator的调试模式
  • 在AgentScope中实现结构化输出
  • 12315投诉,解决投诉内容无法粘贴问题,快速复制粘贴。1秒钟投诉京东。
  • 2025版基于springboot的校园打印社管理系统
  • 深入浅出CRC校验:从数学原理到单周期硬件实现 (3)CRC线性反馈移位寄存器
  • 怎么测量磁阻与等效磁路长度
  • 数据库中悲观锁小结
  • CSS高级技巧---精灵图、字体图标、布局技巧
  • 克服 MongoDB C# 驱动程序的局限性
  • 详解MySQL JSON字段索引设置方案
  • 从基础到实践(四十五):车载显示屏LCD、OLED、Mini-LED、MicroLED的工作原理、设计差异等说明
  • 汽车座椅固定装置及头枕强度动静态试验系统
  • 机器学习-过拟合和欠拟合
  • win11business和consumer版本有什么区别
  • 一个支持多平台的 AI 客户端
  • 浏览器调试工具详解
  • <测量透明液体折射率的深度学习方法>论文总结
  • 下载 MNIST 数据集方法 mnist_train.csv 和 mnist_test.csv
  • 【完整源码+数据集+部署教程】足球场景分割系统: yolov8-seg-C2f-EMBC
  • 算法 --- 链表
  • 技术演进中的开发沉思-99 Linux服务编程系列:程序员视角下的 TCP/IP 通信案例
  • 面试(二)
  • 计算机技术在国有企业档案信息化建设的应用
  • 2025.9.11英语红宝书【必背1-5】
  • Python核心语法篇【1】:环境安装配置与第一个“Hello World”程序
  • 【C++练习】18.C++求两个整数的最小公倍数(LCM)