当前位置: 首页 > news >正文

Self - RAG工作步骤

Self - RAG工作步骤
步骤1:根据输入提示和先前生成内容,判断是否增加检索文段,若需要则输出检索标记调用检索模型。
步骤2:同时处理多个检索文段,评估相关性后生成任务输出。
步骤3:生成评论标记批评输出,选择事实准确性和整体质量最优的生成结果。这个过程与传统的RAG不同,后者不管检索是否有必要,都会一律检索固定数量的文档进行生成,并且从不第二次访问生成质量。
此外,Self-RAG为每个部分提供引文,附带自我评估是否输出受文段支持,从而简化了事实验证。
2.2. 训练方式
改进的Self-RAG训练任意的语言模型(LM),以大模型Qwen2.5为例,通过将反思标记整合为来自扩展模型词汇表的下一个标记预测,以生成文本;
①将反思标记整合到原始语料库,通过训练好的评论模型离线插入,降低训练开销。评论模型在特定数据集上进行监督学习。
②提供可定制的解码算法,通过反思token预测定义约束,灵活调整检索频率,满足用户偏好。
受启发于强化学习中使用的奖励模型,通过训练好的评论模型,将反思token离线插入到原始语料库中原始文本中。这消除了在训练过程中托管评论模型的需求,降低了开销。评论模型在一定程度上是在通过提示专有的LLM收集的输入、输出和相应的反思标记数据集上进行监督学习的。尽管从使用控制标记启动和指导文本生成的研究中汲取灵感,但论文训练的LLM在生成输出的一个部分之后使用评论标记来评估自己的预测,作为生成输出的一个组成部分。
改进的Self-RAG进一步提供了可定制的解码算法,以满足硬性或软性约束,这些约束由反思token的预测定义。通过使用反思标记通过基于段的权重线性和作为段分数的算法来定制模型的行为以满足用户的偏好。
改进的Self - RAG是一种将检索与生成相结合的技术。传统的基于检索的方法在获取信息时可能不够精准,而基于生成的方法可能缺乏事实依据。改进的Self - RAG通过优化检索策略和生成模型的融合方式,提高了信息获取和处理的准确性.

http://www.dtcms.com/a/278811.html

相关文章:

  • 【HTML】五子棋(精美版)
  • 【Java EE】多线程-初阶 认识线程(Thread)
  • 【C语言进阶】指针面试题详解(2)
  • 面试 | JS 面试题 整理(更ing)2/34
  • Android 16系统源码_窗口动画(二)窗口显示动画源码调用流程
  • 护照阅读器:国外证件识别的 OCR “解码师”
  • Python 中调用阿里云 OCR(Optical Character Recognition,光学字符识别)服务
  • STM32介绍和GPIO
  • stm32-Modbus主机移植程序理解以及实战
  • argus/nvarguscamerasrc 远程显示报错
  • 项目一第一天
  • 纯数学专业VS应用数学专业:这两个哪个就业面更广?
  • C++后端面试八股文
  • Linux 基础命令详解:从入门到实践(1)
  • JAVA 并发 ThreadLocal
  • RestAssured(Java)使用详解
  • 19.数据增强技术
  • 管程! 解决互斥,同步问题的现代化手段(操作系统os)
  • Java行为型模式---模板方法模式
  • Imx6ull用网线与电脑连接
  • SpringBoot JAR 反编译替换文件
  • 【嵌入式汇编基础】-操作系统基础(三)
  • 【每日刷题】移动零
  • LabVIEW-Origin 船模数据处理系统
  • 【爬虫】Python实现爬取京东商品信息(超详细)
  • 期权和期货的区别主要是什么?
  • [论文阅读] 人工智能 | 用大型语言模型玩转多语言主观性检测:CheckThat! 2025赛事中的亮眼表现
  • Unity3D + VS2022连接雷电模拟器调试
  • 【PTA数据结构 | C语言版】字符串连接操作(不限长)
  • 分布式一致性协议