当前位置: 首页 > news >正文

模型蒸馏过程中的“软目标”与“温度”

1. 概念阐释:

想象一下,你是个小孩子(小模型),想学画画。你的老师(大模型)是个世界级画家,他画了一幅非常复杂的画。传统上,你只被教“画完后,这幅画是猫还是狗”(硬目标)。

但知识蒸馏不一样。老师会告诉你:“这块区域,虽然看起来像猫的胡须,但如果仔细看,它也有一点点像狗的耳朵,还有非常非常微弱的一点点像树叶。” 老师不仅告诉你“是什么”,还会告诉你“有多像其他东西”。这种细致的“感觉”就是 “软目标”

“温度”,就像老师在告诉你这些细微感觉时,会稍微 “放慢语速,说得更清楚一点”。让这些本来很小的“像不像”变得更容易被你这个小孩子(小模型)听懂和模仿。

在Hinton的原始论文中,知识蒸馏的核心思想是:让“学生模型”不只学习“正确答案”本身,更要学习“老师模型”在给出“正确答案”时,对“其他答案”的“倾向性判断”

我们来具体拆解一下:

  • “硬目标”: 这就是我们通常训练模型时用的“正确答案”。比如,

相关文章:

  • 中国森林地上和地下植被碳储量数据集(2002~2021)
  • glibc 交叉编译
  • LUA+Reids实现库存秒杀预扣减 记录流水 以及自己的思考
  • Maven​​ 和 ​​Gradle​​ 依赖管理的详细说明及示例,涵盖核心概念、配置方法、常见问题解决和工具对比。
  • Python正则表达式re模块
  • 小白升级的路-电子电路
  • 2025年5月月赛 乙组T1~T3
  • 建筑设备一体化监控系统:提升能效与运维效率
  • Kubernetes 集群到 Jumpserver
  • 软件开发中的“需求镀金”现象如何避免?
  • web第十次课后作业--Mybatis的增删改查
  • 中英文翻译数据集(17245条),AI智能体知识库数据收集~
  • COMSOL学习笔记-静电场仿真
  • 如何防止看板任务长期停滞不前
  • ROS2--导航仿真
  • 日语学习-日语知识点小记-构建基础-JLPT-N4阶段(32):そうやすいにくいすぎ(過ぎ)
  • Java-IO流之缓冲流详解
  • 桌面鼠标右键新建没有记事本怎么恢复
  • 【缺陷】温度对半导体缺陷电荷态跃迁能级的影响
  • Spring AI(11)——SSE传输的MCP服务端
  • 在线免费建网站/产品seo是什么意思
  • 网站首页地址是什么/html友情链接
  • 学院网站建设流程图/网站模版
  • 网页游戏折扣充值平台/成都网站优化
  • 网站建设 文库/中公教育培训机构官网
  • 0建设营销型网站步骤介绍/网店代运营可靠吗