当前位置: 首页 > news >正文

【机器学习】Teacher-Student框架

Teacher-Student Setup是一个经典的机器学习框架,包含两个核心角色:

    • 教师模型 (Teacher Model)

      • 通常是一个更大、更强、已经训练好(或正在训练)的模型。
      • 它对问题有很好的理解,性能优秀。
      • 它的作用是为学生提供“指导”。
    • 学生模型 (Student Model)

      • 通常是一个更小、更轻量级的模型。
      • 它的目标是学习教师的能力,最终在性能上接近甚至超越教师(在特定任务上)。
      • 学生不仅从真实标签 (hard labels) 中学习,还会从教师的输出 (soft labels) 中学习。
  1. 教师如何“教”学生?—— 知识蒸馏 (Knowledge Distillation)
    这是最核心的机制:

    • Hard Labels (硬标签):原始数据中的正确答案,比如图片是“猫”,标签就是 [0, 1, 0]
    • Soft Labels (软标签):教师模型输出的概率分布。例如,对于一张猫的图片,教师可能输出 [0.05 (狗), 0.9 (猫), 0.05 (虎)]。这个分布包含了教师的“思考过程”——它知道这张图非常像猫,但也有一点点像狗和虎
    • 学习过程:学生模型的损失函数(Loss Function)通常由两部分组成:
      1. 一部分是与真实标签计算的损失(如交叉熵)。
      2. 另一部分是与教师的软标签计算的损失,目标是让学生的输出分布与教师的输出分布尽可能相似。

相关文章:

  • 使用freemarker模板 生成 word文档
  • 【论文阅读笔记】高光反射实时渲染新突破:3D Gaussian Splatting with Deferred Reflection 技术解析
  • Spring MVC 常用请求处理注解总结
  • 三轴云台之运动控制系统篇
  • uniapp——input 禁止输入 ,但是可以点击(禁用、可点击)
  • php列表头部增加批量操作按钮,多选订单数据批量微信退款(含微信支付SDK)
  • Kafka入门:解锁核心组件,开启消息队列之旅
  • 如何“下载安转Allure”?
  • UML和模式应用(软件分析设计与建模期末复习)
  • leetcode 从中序与后序序列 or 从前序与中序序列 构造二叉树 java
  • 【大模型应用开发】基于langchain的大模型调用及简单RAG应用构建
  • MATLAB griddatan 函数支持的插值方法MATLAB 的 griddatan 函数主要支持以下几种插值方法
  • 【系统时间不同步】
  • P10987 [蓝桥杯 2023 国 Python A] 火车运输
  • 芯片制程变化
  • 主流邻近标记技术解析与应用
  • ARM 和 x86_64是什么关系
  • Oracle Form判断表单数据重复方法
  • 用idea进行数据同步
  • 大中台应用的层次抽象
  • wordpress美女图片站源码/江小白网络营销案例
  • 网站优化怎么做分录/广州关键词搜索排名
  • 网站底部特效/百度小说风云榜2022
  • 网页游戏网站网址/教育培训机构排名
  • 最新网站推广哪家好/四川百度推广排名查询
  • 注册公司需要啥资料/官网seo是什么