当前位置: 首页 > news >正文

RAG基本原理

1.RAG全称是Retrieval-Augmented Generation

Generation 的含义是 基于用户的输入,生成具有上下文含义的一段文字。
Query 比如说 太阳系中,哪个行星拥有的卫星数目最多?
回答Answer 木星,木星目前有79个卫星
这样的回答存在两个问题,1.无法追溯知识来源 2.可能会存在信息过时的问题(随着科学技术的进步,可能很多没有被发现的卫星被人类发现,或者说 另一个行星的卫星数目更多,这样以往的回答就失去了正确性)
但是实际答案发现这也是错误的信息,因为木星实际上是用有卫星最多的行星,截止到目前为止
参考链接:美国航天局

Deepseek尝试,发现Deepseek也同样给出了错误的回答,因此我认为RAG是一项非常重要的技术。

在这里插入图片描述

2.RAG实现流程

在这里插入图片描述
如上图所示,原本我们输入Prompt给大模型,然后大模型返回输出的response给我们,但是大模型中如果没有相关知识,或者相关知识存在歧义,那我们就很容易得到错误的回答。但是我们增加了检索增强的内容给大模型,大模型自身的逻辑推理能力,会输出source输入相关内容,有利于提高答案的准确性,提高生成内容的质量。简单的来说,RAG就是为了让大模型有更好的输出。

Prompt工程RAGFine-tuning
定义:提供给大模型的输入即为Prompt,基于此输入,LLM生成响应定义:将Prompting工程与数据库查询结合起来,以获取上下文丰富的答案定义:使用特定任务的数据调整LLM的参数,以使其在某个领域更加专业化
用途:通过提供精炼的输入来引导模型的输出,生成的输入也是基于大模型现有的知识用途:生成的输出将会基于数据库中可用的知识,从而实现更具上下文的相应用途:可以在特定领域上对语言模型进行Fine-tuning,使其更擅长大模型在该领域的应用

3.Prompting vs Fine-tuning vs RAGs

在这里插入图片描述
参考引用资料:链接

相关文章:

  • FFMPEG编码容错处理解决办法之途径----升级库文件
  • MacOS Sequoia 15 允许任何来源app安装最新解决方案
  • C#上位机--进程和线程的区别
  • 《Head First设计模式》读书笔记 —— 单件模式
  • ESP32-S3 实战指南:BOOT-KEY 按键驱动开发全解析
  • 行为正则化与顺序策略优化结合的离线多智能体学习算法
  • Java 第十章线程(2)
  • MarsCode 49
  • 细说STM32F407单片机1个ADC使用DMA同时采集3个输入通道的方法
  • ProfiNet转EtherNet/IP攻克罗克韦尔PLC与光伏电站监控系统连接难题的通讯配置技术
  • Pytorch实现之结合SE注意力和多种损失的特征金字塔架构GAN的图像去模糊方法
  • CLIP学习笔记
  • 安全运维,等保测试常见解决问题。
  • 智慧校园系统在学生学习与生活中的应用
  • RK Android11 WiFi模组 AIC8800 驱动移植调试记录
  • 力扣-回溯-37 解数独
  • JavaScript异步编程方式多,区别是什么?
  • 有时候通过无线上网,有线共享局域网通过该有线为网关进行上网,设置指定的网关IP信息
  • UE5 编辑器辅助/加强 插件搜集
  • C#使用Semantic Kernel:接入本地deepseek-r1
  • 公募基金行业迎系统性变革:基金公司业绩差必须少收费
  • 自然资源部印发地理信息数据分类分级指南
  • 涉个人信息收集使用问题,15款App和16款SDK被通报
  • 中国公民免签赴马来西亚的停留天数如何计算?使馆明确
  • 山东滕州车祸致6人遇难,肇事司机已被刑事拘留
  • 世界哮喘日丨张旻:哮喘的整体诊断率不足三成,吸入治疗是重要治疗手段