当前位置: 首页 > news >正文

知识蒸馏:从模型输出到深层理解

1. 概念阐释:

还记得上次说的“老师教你画画,不只教‘猫’,还教‘像狗像树叶’的细微感觉”吗?那是最初的蒸馏。

后来大家发现,老师不仅仅通过“最后画出来像什么”来教你。

  • 有时候,老师是教你“他画画时,哪里用了力气,哪里画得特别认真”(这叫基于特征的蒸馏,学习老师画画的“内在过程”)。
  • 有时候,老师是教你“这只猫和旁边那只老虎,它们之间有什么不同和相似”(这叫基于关系的蒸馏,学习老师对不同东西的“比较和连接”)。

所以,知识蒸馏就像是,老师有很多种高级的教学方法,不只通过最终的“画作”来教你,还通过他“画画的技巧”和“对不同画的理解和比较”来教你,让你这个小孩子(小模型)学得更全面,更聪明!

自Hinton开创性的基于Logits的知识蒸馏后,研究者们发现,“知识”不仅仅是最终的预测概率,它还能以其他形式存在于教师模型中,并能被有效地传递。这导致了知识蒸馏方法的极大丰富。

A. 不同类型的知识蒸馏(知识传

http://www.dtcms.com/a/233548.html

相关文章:

  • 【QQMusic】在LikePage点击取消喜欢没有反应
  • OptiStruct结构分析与工程应用:无限元分析指南
  • graylog收集rsyslog实现搜索解析
  • JS手写代码篇---bind手写
  • python摆放花盆 2023年信息素养大赛复赛/决赛真题 小学组/初中组 python编程挑战赛 真题详细解析
  • 如何利用Haption力反馈遥操作机器人解决远程操作难题
  • 25_06_05Ubuntu系统root密码破解
  • ros2--大数据包丢帧问题
  • 【DAY40】训练和测试的规范写法
  • 全国邮政编码,包括:省份 市 县区 长途区号 邮政编码
  • EFI(x64)简易开发环境
  • JavaScript 循环方法对比指南
  • 什么是软中断、硬中断
  • World of Warcraft [Vault of Archavon][Reins of the Grand Black War Mammoth]
  • 【git】把本地更改提交远程新分支feature_g
  • 【大模型RAG】六大 LangChain 支持向量库详细对比
  • python学习day39
  • Python应用函数调用(二)
  • invalid literal for int() with base 10: ‘27.0‘
  • Liunx进程替换
  • C获取unix操作系统的信息
  • 行业赋能篇-2-能源行业安全运维升级
  • Python数据可视化科技图表绘制系列教程(四)
  • 大中型水闸安全监测管理系统建设方案
  • CppCon 2015 学习:C++ Coroutines
  • 深入理解Java多态性:原理、实现与应用实例
  • Astro深度解析:颠覆传统的前端架构革命,打造极致性能的现代Web应用
  • [Git] 文件删除
  • 虚拟机网络配置
  • Java爬虫技术详解:原理、实现与优势