当前位置：首页 > news >正文

LLM中如何添加special_token，并且尽可能保持原模型的训练效果

news 2025/9/20 5:38:08

在SFT（Supervised Fine-Tuning）阶段为LLM添加special_token（例如用于分隔用户和助手的<|user|>，<|assistant|>等）是一个非常常见的操作，但如果处理不当，确实会严重影响模型原有的性能。

核心问题在于：新添加的token在模型的词向量矩阵（Embedding Matrix）和输出层（LM Head）中没有对应的、经过预训练的向量，它们是“从零开始”的，这会给模型带来巨大的扰动。

为了尽可能保持原模型的训练效果，你需要遵循一套系统性的策略，核心思想是：让新token的初始状态尽可能“平滑”地融入现有模型，并通过高效的微调方式让模型“温柔”地学会其用法。

以下是详细的步骤、策略和代码示例：

参考链接：https://mp.weixin.qq.com/s/pmgKnMXrP9J01ocfe3zauA

http://www.dtcms.com/a/390427.html

相关文章：

[x-cmd] 使用系统包管理器安装 x-cmd

亮数据MCP结合Dify：构建自动化视频数据抓取与智能分析工作流的深度实践

革新交互体验，开启未来智慧生活 —— OPE.AI 多语言多模态AI产品

生活琐记（2）

一文读懂HTTP 1.1/2.0/3.0：从原理到应用的通俗解析

JavaStream用法全解析

在日常开发中实现异常处理和空值处理的最佳实践

openstack port binding failure (by quqi99)

leetcode 3484. 设计电子表格中等

Docker+cpolar 实战：打造灵活可控的远程办公系统

uniApp开发XR-Frame微信小程序 | 设置透明贴图

M3 Ultra版Mac Studio无法正常升级到macOS 26.0 苹果已经在调查

老的ios项目在新的mac M1上编译运行遇到的问题及整理

Java 大视界 -- Java 大数据机器学习模型在元宇宙虚拟场景智能交互中的关键技术

2025年目标检测还有什么方向好发论文？

离线openHarmonySdk鸿蒙系统动态库的封装

从零实现鸿蒙智能设备数据采集：权限、传感器、云端上传全流程实战

智慧医院IBMS中央集成系统解决方案：构建医疗安全优先的智慧运营中枢

✅ Python房源数据采集+分析+预测平台 requests爬虫+sklearn回归大数据实战项目（建议收藏）机器学习（附源码）

结婚证 OCR 识别：政务服务提速的 “关键一环”

Git企业开发--多人协作

【论文阅读 | IF 2025 | IF-USOD：用于水下显著目标检测的多模态信息融合交互式特征增强架构】

【14/20】安全强化：HTTPS 和率限制在 Express 中的应用，实现防护机制

C#调用钉钉API实现安全企业内部通知推送

MyBatis与MyBatis-Plus区别

数据血缘探秘：用SQL串联不同数据源的脉络

多线程程序性能优化：缓存命中率与伪共享深度剖析

Spring Boot支持哪些类型的自定义配置文件？

uniapp：scss变量使用方法

postman接口测试系列：时间戳和加密