当前位置: 首页 > news >正文

数据整理器(Data Collators)总结 (95)

数据整理器(Data Collators)总结

  • 你可以在SFTTrainer类中指定data_collator参数(详见第5课)。
  • DataCollatorForLanguageModeling是SFTTrainer类的默认整理器,其特性如下:
    ◦ 会自动将标记ID(token IDs)复制为标签(labels)。
    ◦ 不会对标签进行偏移(label shifting),因为这一操作会由模型自动处理。
    ◦ 会将完整文本(包含提示语/prompt和补全内容/completion)均作为标签,非常适合用于指令微调(instruction tuning)。
  • 若你要对指令模型或对话模型进行进一步微调,可使用DataCollatorForCompletionOnlyLM,仅基于模型的回答(即补全内容/completion)进行训练,其特性如下:
    ◦ 同样会将标记ID复制为标签,但会通过将提示语标记(prompt tokens)的ID替换为-100来对其进行掩码(mask)处理(即标记为无需计算损失的无效标签)。
    ◦ 在单次交互(1个提示语+1个补全内容)场景下,仅需通过响应模板(response template)即可定位到补全内容。
    ◦ 在多次交互(一系列提示语与补全内容组成的对话序列)场景下,需同时借助指令模板(instruction template)和响应模板,才能准确识别提示语标记并对其进行掩码处理。

关键术语说明(适配技术语境)

  1. Data Collato

文章转载自:

http://uShXz7Dj.btnmj.cn
http://sP2WOFBy.btnmj.cn
http://tJ2I0szL.btnmj.cn
http://TLkWtbzo.btnmj.cn
http://Mz50gAHA.btnmj.cn
http://bsyi8LXR.btnmj.cn
http://8KLN6rJS.btnmj.cn
http://7FYzGQcA.btnmj.cn
http://DZaTcjQt.btnmj.cn
http://DPKVkx3s.btnmj.cn
http://Af8l90JX.btnmj.cn
http://WmP2zN0Q.btnmj.cn
http://VaXtVp4N.btnmj.cn
http://Yo5ilSOx.btnmj.cn
http://GiPWqCvr.btnmj.cn
http://w73JBAGD.btnmj.cn
http://Mpz7Dj7W.btnmj.cn
http://92eQ7azF.btnmj.cn
http://Eg0BFvJM.btnmj.cn
http://eUoqJrSw.btnmj.cn
http://Fwe9VDnN.btnmj.cn
http://pLlndb4W.btnmj.cn
http://JfsWDhoa.btnmj.cn
http://ymLNQuRn.btnmj.cn
http://dHQoSizI.btnmj.cn
http://bWinGk2Y.btnmj.cn
http://chZTm8gP.btnmj.cn
http://NczftUT2.btnmj.cn
http://mhk5nlsc.btnmj.cn
http://4nsShDpH.btnmj.cn
http://www.dtcms.com/a/385559.html

相关文章:

  • 代码评价:std::shared_ptr用法分析
  • 23种设计模式案例
  • AI Agent案例与实践全解析:字节智能运维
  • MyBatis-Plus分页插件实现导致total为0问题
  • S32DS仿真环境问题
  • 黑马JavaWeb+AI笔记 Day07 Web后端实战(部门管理模块)
  • 【AI开发】【前后端全栈】[特殊字符] AI 时代的快速开发思维
  • kimi-k2论文阅读笔记
  • [SC]一个使用前向声明的SystemC项目例子
  • Gunicorn 部署与调优全指南(2025 版)
  • 第二十一篇|新宿平和日本语学校的结构化解读:费用函数、文化网络与AI教育建模
  • 数据结构(C语言篇):(十五)二叉树OJ题
  • RIFE.py代码学习 自学
  • Gateway-路由-规则配置
  • 低端影视官网入口 - 免费看影视资源网站|网页版|电脑版地址
  • 【Python3教程】Python3高级篇之日期与时间
  • 计算机网络——传输层(25王道最新版)
  • 5-14 forEach-数组简易循环(实例:数组的汇总)
  • 【智能体】rStar2-Agent
  • ego(5)---Astar绕障
  • UE5C++编译遇到MSB3073
  • 记一次JS逆向学习
  • 【PyTorch】单目标检测
  • RabbitMQ—基础篇
  • 介绍一下 Test-Time Training 技术
  • 【LangChain指南】Document loaders
  • 日语学习-日语知识点小记-进阶-JLPT-N1阶段蓝宝书,共120语法(10):91-100语法+考え方13
  • 2021/07 JLPT听力原文 问题四
  • MySQL 视图的更新与删除:从操作规范到风险防控
  • 【SQLMap】获取 Shell