当前位置: 首页 > news >正文

【自然语言处理与大模型】RAFT(Retrieval Augmented Fine Tuning)方法

如果把大模型回答问题当做一场考试。微调可以看做闭卷考试,开卷考试则是RAG。

  • 闭卷考试 ≈ 微调(Fine-tuning):模型像一个学生,只能依靠自己“背”下来的知识来答题。如果训练数据中没有某个知识,它就答不上来,甚至会“凭感觉”胡说。
  • 开卷考试 ≈ RAG(Retrieval-Augmented Generation):模型像一个学生,可以翻书、查资料,根据检索到的信息来回答问题。这样答案更准确、有据可依。

那么,RAFT(Retrieval-Augmented Fine-Tuning) 是什么呢?

一、什么是RAFT?

(1)假设我们要教一个学生准备历史考试

情况1:传统微调(闭卷)

我们只给他一本教科书,让他背下来。考试时不准翻书。

结果是:他只能靠记忆答题。如果题目超纲了,他就答不出来。

情况2:RAG(开卷)

考试时允许他带一堆参考书,遇到不会的题就翻书查。

结果是:他能答对很多题,但每次都要花时间查资料,效率低,而且如果检索不准,答案也会错。还可能出现“有书不会用”的情况(比如他是个外国人从来没学过中文和中国历史)。

情况3:RAFT(用开卷来训练闭卷)

我们先让他用开卷的方式做大量练习题(比如1000道历史题,每道题都附带从资料书中检索到的正确段落)。但在训练过程中,我们只保留那些“检索到的正确资料 + 正确答案” 的样本,过滤掉检索错误或答案错误的样本。然后,我们用这些高质量的“问题+正确上下文+正确答案”数据,去微调模型

结果是:这个学生最终考试哪怕是闭卷,但他已经“学到了”很多原本不在他知识库里的内容,而且学得更准、更可靠。

(2)RAFT的核心思想

  1. 先用 RAG 的方式运行一遍:对每个训练样本,检索相关文档,生成答案。
  2. 筛选高质量的训练样本:只保留那些检索准确、生成答案也准确的样本。
  3. 用这些“黄金样本”去微调模型。

问题RAG 的局限RAFT 的改进
检索不准检索到错误文档,导致答案错误只用高质量检索结果训练,模型学到更可靠的知识
推理慢每次都要检索,延迟高微调后模型“内化”了知识,推理更快
知识固化模型本身没学到新知识模型通过高质量数据真正“学会”了新内容

二、如何进行RAFT?

(1)步骤一:准备问答对和外部知识库

        你需要一组原始的问答对(可以是用户问题或任务数据)和一个结构化的外部知识库(如维基百科、公司文档、数据库等)

(2)步骤二:使用RAG进行检索增强生成

        对每个问题使用检索器(如 BM25、DPR、向量数据库)从知识库中查找最相关的文档片段。然后将问题 + 检索到的上下文输入大模型,生成答案。

(3)步骤三:筛选高质量样本

        留那些检索正确、生成也正确的样本。可以通过以下方式筛选:

  • 人工标注:专家判断答案是否准确
  • 自动评估:使用评分模型(如 BERTScore、ROUGE-L)对比标准答案
  • 规则过滤:比如排除包含“可能”、“大概”等不确定词的回答
  • 一致性检查:多次生成取共识

(4)步骤四:构造微调数据集

将筛选后的样本构造成标准的监督学习格式:

{"input": "原始问题","context": "检索正确的文本","output": "模型生成正确的回答"
}

(5)步骤五:微调大模型

        使用上述高质量数据集对预训练语言模型(如 LLaMA、ChatGLM、Qwen)进行监督微调(SFT)。训练完成后,模型就具备了“内化”的知识,即使不联网、不检索,也能准确回答问题。

  • 如果允许开卷(RAG模式),它能极其高效、精准地利用提供的参考书(检索到的文档)来组织答案,因为它在“特训”中专门练过这个。
  • 即使不允许开卷(纯生成模式),它也能凭借在“特训”和“巩固”中内化的知识和策略,给出比普通闭卷学生(纯微调模型)更准确、更符合领域要求的答案,因为它学过如何“像开卷一样思考”。
  • 它对参考书(检索器)的依赖降低了,即使偶尔检索到不太完美的文档,它也能凭借学到的策略更好地处理。
http://www.dtcms.com/a/405738.html

相关文章:

  • 湖南网站建设公司 找磐石网络一流跨境电商平台app排名
  • 动态IP使用中 报错407 怎么办???
  • 手机百度建设网站台州企业网站建设
  • 鞍山网站建设制作新潮远网站建设
  • 网站友情链接的好处东莞专业微网站建设
  • 二级学院英语网站建设通知wordpress login网址
  • 计算机专业大学排名seo统计
  • 织梦网站怎么加入引导页成都最值得一去的地方
  • 手机网站需要什么c 网站开发需要学什么
  • 教人做美食视频网站wordpress开发上传图片
  • 做图网站有哪些注册网站给谁交钱
  • 昆明工程建设信息网站广元网站建设
  • 网站模板与网站定制版的区别服务商平台登录
  • 网站建设有什么出路赤壁市药监局网站建设方案
  • 怎么做下载类的网站吗域名官网
  • 怎么做域名网站wordpress 菜单路径
  • 进网站备案时间企业网站带后台
  • 网页超链接到别的网站404沈阳做网站公司有哪些
  • 东莞常平医院网站建设用dw做淘宝网站
  • 做网站需要哪些网站支付接口如何做
  • 个人网站建设案例教程网站域名哪里买
  • 门户网站后台管理模板宝安在深圳算什么档次
  • 开源手机建站系统北京专业网站设计公司
  • 怎么建网站新手入门中国建设银行网站成都第七支行
  • 做亚马逊和淘宝网站网站评估做的好不好
  • 中小企业网站建设框架西安建设市场诚信信息平台网站
  • 南隼深圳网站建设四平seo
  • 网站备案在哪里审批咔咔做受视频网站
  • 网站管理后台地址做网站的公司现在还 赚钱吗6
  • 企业静态网站源码注册建筑公司名字大全