当前位置: 首页 > news >正文

什么是检索增强生成(RAG)?

什么是检索增强生成(RAG)?

检索增强生成(Retrieval-Augmented Generation,简称RAG),从名字就能看出,这是一种专为信息检索设计的技术。它的思路非常直接:假设你有大量文档,想要从中搜索并提取信息——就像向一个“知道答案的人”提问,或者是,向一个“已经研读了你提供的所有材料的人”提问。当被询问时,这个人不仅能指出信息在材料中的位置,还能组织出恰当的文字回答。

在RAG技术中,这个“人”就是大语言模型(LLM),那些“研读材料”被称为上下文(context),而最终的文字回答则是基于从“增强知识”(即那些研读材料或上下文)中检索(R) 到的信息生成(G)的输出。当然,回答的质量取决于材料的质量和数量:上下文需要包含相关信息,但不能掺杂过多无关内容。和人类一样,模型往往会更关注开头和结尾的信息;随着上下文长度增加,模型准确定位所需信息的难度也会越来越大。

因此,RAG流程中一个非常重要的步骤是:筛选出最可能包含答案的文档并整合成上下文,而不是把所有材料都给模型。

RAG是一种灵活性很强的技术,它的效果依赖于通用大语言模型的能力。再用刚才的类比:LLM就像一个受过良好教育的人,只要你让它研读某个主题的材料,它就能回答相关问题。任何时候,你都可以给它换一批不同主题的内容,或者更新版本的材料,再让它回答新的问题。这里的关键是:这个人受教育程度越高,无论面对什么主题,给出的答案质量就越好。对应到语言模型上,这意味着在预算允许的情况下,选择尽可能大的通用模型通常效果更好——对于RAG来说,我们需要的是一个“多面手”。

如果说RAG是“通才的技术”,那么微调就是“专才

http://www.dtcms.com/a/293089.html

相关文章:

  • java调用周立功USBCAN SDK读取汽车总线数据
  • [3-02-02].第04节:开发应用 - RequestMapping注解的属性2
  • TCP头部
  • Kotlin伴生对象
  • Go后端配置文件教程
  • LeetCode|Day22|231. 2 的幂|Python刷题笔记
  • AI一周事件(2025年7月15日-7月21日)
  • 开发避坑短篇(4):跨域请求中Session数据丢失的排查与修复方案
  • Qt资源系统:如何有效管理图片和文件
  • 【黑马SpringCloud微服务开发与实战】(五)微服务保护
  • 【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts) 视频教程 - 访问鉴权功能实现
  • MMDeploy模型转换与TensorRT推理遇到问题及解决方案
  • GRU模型
  • Trae安装指定版本的插件
  • Clickhouse源码分析-副本数据同步
  • 网络编程---TCP协议
  • Spring AI 系列之十九 - Ollama集成Deepseek
  • 配置https ssl证书生成
  • 数字护网:一次深刻的企业安全体系灵魂演练
  • 接口测试用例选择及效能优化策略
  • vcs门级仿真(后仿真)指南
  • 如何处理各行业的DDOS问题?
  • VUE2 学习笔记3 v-on、事件修饰符、键盘事件
  • JAVA后端面试笔记
  • 前端性能优化:从“龟速“到“闪电“的终极加速指南
  • c++day05(ASCII)
  • Git GitHub精通:前端协作开发的“瑞士军刀“!
  • 字符串相关函数
  • visual studio 性能调试
  • 大数据之Hive:Hive中week相关的几个函数