当前位置: 首页 > news >正文

LLM中如何添加special_token,并且尽可能保持原模型的训练效果

在SFT(Supervised Fine-Tuning)阶段为LLM添加special_token(例如用于分隔用户和助手的<|user|>,<|assistant|>等)是一个非常常见的操作,但如果处理不当,确实会严重影响模型原有的性能。

核心问题在于:新添加的token在模型的词向量矩阵(Embedding Matrix)和输出层(LM Head)中没有对应的、经过预训练的向量,它们是“从零开始”的,这会给模型带来巨大的扰动

为了尽可能保持原模型的训练效果,你需要遵循一套系统性的策略,核心思想是:让新token的初始状态尽可能“平滑”地融入现有模型,并通过高效的微调方式让模型“温柔”地学会其用法

以下是详细的步骤、策略和代码示例:

参考链接:https://mp.weixin.qq.com/s/pmgKnMXrP9J01ocfe3zauA

http://www.dtcms.com/a/390427.html

相关文章:

  • [x-cmd] 使用系统包管理器安装 x-cmd
  • 亮数据MCP结合Dify:构建自动化视频数据抓取与智能分析工作流的深度实践
  • 革新交互体验,开启未来智慧生活 —— OPE.AI 多语言多模态AI产品
  • 生活琐记(2)
  • 一文读懂HTTP 1.1/2.0/3.0:从原理到应用的通俗解析
  • JavaStream用法全解析
  • 在日常开发中实现异常处理和空值处理的最佳实践
  • openstack port binding failure (by quqi99)
  • leetcode 3484. 设计电子表格 中等
  • Docker+cpolar 实战:打造灵活可控的远程办公系统
  • uniApp开发XR-Frame微信小程序 | 设置透明贴图
  • M3 Ultra版Mac Studio无法正常升级到macOS 26.0 苹果已经在调查
  • 老的ios项目在新的mac M1上编译运行遇到的问题及整理
  • Java 大视界 -- Java 大数据机器学习模型在元宇宙虚拟场景智能交互中的关键技术
  • 2025年目标检测还有什么方向好发论文?
  • 离线openHarmonySdk鸿蒙系统动态库的封装
  • 从零实现鸿蒙智能设备数据采集:权限、传感器、云端上传全流程实战
  • 智慧医院IBMS中央集成系统解决方案:构建医疗安全优先的智慧运营中枢​
  • ✅ Python房源数据采集+分析+预测平台 requests爬虫+sklearn回归 大数据实战项目(建议收藏)机器学习(附源码)
  • 结婚证 OCR 识别:政务服务提速的 “关键一环”
  • Git企业开发--多人协作
  • 【论文阅读 | IF 2025 | IF-USOD:用于水下显著目标检测的多模态信息融合交互式特征增强架构】
  • 【14/20】安全强化:HTTPS 和率限制在 Express 中的应用,实现防护机制
  • C#调用钉钉API实现安全企业内部通知推送
  • MyBatis与MyBatis-Plus区别
  • 数据血缘探秘:用SQL串联不同数据源的脉络
  • 多线程程序性能优化:缓存命中率与伪共享深度剖析
  • Spring Boot支持哪些类型的自定义配置文件?
  • uniapp:scss变量使用方法
  • postman接口测试系列: 时间戳和加密