当前位置: 首页 > news >正文

知识蒸馏:从模型输出到深层理解

1. 概念阐释:

还记得上次说的“老师教你画画,不只教‘猫’,还教‘像狗像树叶’的细微感觉”吗?那是最初的蒸馏。

后来大家发现,老师不仅仅通过“最后画出来像什么”来教你。

  • 有时候,老师是教你“他画画时,哪里用了力气,哪里画得特别认真”(这叫基于特征的蒸馏,学习老师画画的“内在过程”)。
  • 有时候,老师是教你“这只猫和旁边那只老虎,它们之间有什么不同和相似”(这叫基于关系的蒸馏,学习老师对不同东西的“比较和连接”)。

所以,知识蒸馏就像是,老师有很多种高级的教学方法,不只通过最终的“画作”来教你,还通过他“画画的技巧”和“对不同画的理解和比较”来教你,让你这个小孩子(小模型)学得更全面,更聪明!

自Hinton开创性的基于Logits的知识蒸馏后,研究者们发现,“知识”不仅仅是最终的预测概率,它还能以其他形式存在于教师模型中,并能被有效地传递。这导致了知识蒸馏方法的极大丰富。

A. 不同类型的知识蒸馏(知识传

相关文章:

  • 【QQMusic】在LikePage点击取消喜欢没有反应
  • OptiStruct结构分析与工程应用:无限元分析指南
  • graylog收集rsyslog实现搜索解析
  • JS手写代码篇---bind手写
  • python摆放花盆 2023年信息素养大赛复赛/决赛真题 小学组/初中组 python编程挑战赛 真题详细解析
  • 如何利用Haption力反馈遥操作机器人解决远程操作难题
  • 25_06_05Ubuntu系统root密码破解
  • ros2--大数据包丢帧问题
  • 【DAY40】训练和测试的规范写法
  • 全国邮政编码,包括:省份 市 县区 长途区号 邮政编码
  • EFI(x64)简易开发环境
  • JavaScript 循环方法对比指南
  • 什么是软中断、硬中断
  • World of Warcraft [Vault of Archavon][Reins of the Grand Black War Mammoth]
  • 【git】把本地更改提交远程新分支feature_g
  • 【大模型RAG】六大 LangChain 支持向量库详细对比
  • python学习day39
  • Python应用函数调用(二)
  • invalid literal for int() with base 10: ‘27.0‘
  • Liunx进程替换
  • 昆明网站做的好的公司哪家好/网络舆情监测系统软件
  • 学校网站建设策划书/seo免费培训
  • asp个人网站建设/小广告图片
  • 网站建设多久/深圳百度推广开户
  • 做网站公司名字/网站排名优化外包公司
  • seo 网站文案模板/吸引人的微信软文