当前位置：首页 > news >正文

数据整理器（Data Collators）总结（95）

news 2025/9/16 13:35:34

数据整理器（Data Collators）总结

你可以在SFTTrainer类中指定data_collator参数（详见第5课）。
DataCollatorForLanguageModeling是SFTTrainer类的默认整理器，其特性如下：
◦ 会自动将标记ID（token IDs）复制为标签（labels）。
◦ 不会对标签进行偏移（label shifting），因为这一操作会由模型自动处理。
◦ 会将完整文本（包含提示语/prompt和补全内容/completion）均作为标签，非常适合用于指令微调（instruction tuning）。
若你要对指令模型或对话模型进行进一步微调，可使用DataCollatorForCompletionOnlyLM，仅基于模型的回答（即补全内容/completion）进行训练，其特性如下：
◦ 同样会将标记ID复制为标签，但会通过将提示语标记（prompt tokens）的ID替换为-100来对其进行掩码（mask）处理（即标记为无需计算损失的无效标签）。
◦ 在单次交互（1个提示语+1个补全内容）场景下，仅需通过响应模板（response template）即可定位到补全内容。
◦ 在多次交互（一系列提示语与补全内容组成的对话序列）场景下，需同时借助指令模板（instruction template）和响应模板，才能准确识别提示语标记并对其进行掩码处理。

关键术语说明（适配技术语境）

Data Collato

文章转载自：

http://uShXz7Dj.btnmj.cn
http://sP2WOFBy.btnmj.cn
http://tJ2I0szL.btnmj.cn
http://TLkWtbzo.btnmj.cn
http://Mz50gAHA.btnmj.cn
http://bsyi8LXR.btnmj.cn
http://8KLN6rJS.btnmj.cn
http://7FYzGQcA.btnmj.cn
http://DZaTcjQt.btnmj.cn
http://DPKVkx3s.btnmj.cn
http://Af8l90JX.btnmj.cn
http://WmP2zN0Q.btnmj.cn
http://VaXtVp4N.btnmj.cn
http://Yo5ilSOx.btnmj.cn
http://GiPWqCvr.btnmj.cn
http://w73JBAGD.btnmj.cn
http://Mpz7Dj7W.btnmj.cn
http://92eQ7azF.btnmj.cn
http://Eg0BFvJM.btnmj.cn
http://eUoqJrSw.btnmj.cn
http://Fwe9VDnN.btnmj.cn
http://pLlndb4W.btnmj.cn
http://JfsWDhoa.btnmj.cn
http://ymLNQuRn.btnmj.cn
http://dHQoSizI.btnmj.cn
http://bWinGk2Y.btnmj.cn
http://chZTm8gP.btnmj.cn
http://NczftUT2.btnmj.cn
http://mhk5nlsc.btnmj.cn
http://4nsShDpH.btnmj.cn

http://www.dtcms.com/a/385559.html

相关文章：

代码评价：std::shared_ptr用法分析

23种设计模式案例

AI Agent案例与实践全解析：字节智能运维

MyBatis-Plus分页插件实现导致total为0问题

S32DS仿真环境问题

黑马JavaWeb+AI笔记 Day07 Web后端实战(部门管理模块)

【AI开发】【前后端全栈】[特殊字符] AI 时代的快速开发思维

kimi-k2论文阅读笔记

[SC]一个使用前向声明的SystemC项目例子

Gunicorn 部署与调优全指南（2025 版）

第二十一篇｜新宿平和日本语学校的结构化解读：费用函数、文化网络与AI教育建模

数据结构（C语言篇）：（十五）二叉树OJ题

RIFE.py代码学习自学

Gateway-路由-规则配置

低端影视官网入口 - 免费看影视资源网站|网页版|电脑版地址

【Python3教程】Python3高级篇之日期与时间

计算机网络——传输层（25王道最新版）

5-14 forEach-数组简易循环(实例:数组的汇总)

【智能体】rStar2-Agent

ego(5)---Astar绕障

UE5C++编译遇到MSB3073

记一次JS逆向学习

【PyTorch】单目标检测

RabbitMQ—基础篇

介绍一下 Test-Time Training 技术

【LangChain指南】Document loaders

日语学习-日语知识点小记-进阶-JLPT-N1阶段蓝宝书，共120语法（10）：9１-100语法＋考え方１３

2021/07 JLPT听力原文问题四

MySQL 视图的更新与删除：从操作规范到风险防控

【SQLMap】获取 Shell