当前位置: 首页 > news >正文

AI的拜师学艺,模型蒸馏技术

AI的拜师学艺,模型蒸馏技术

什么是模型蒸馏,模型蒸馏是一种高效的模型压缩与知识转移方法,通过将大型教师模型的知识精炼至小型学生模型,让学生模型模仿教师模型的行为和内化其知识,在保持模型性能的同时降低资源消耗。这里面有两个关键对象,一个是教师模型,一个是学生模型,教师模型负责教,学生模型负责学,这和我们人类的老师学生模式似乎一模一样,看起来很合理,——其实完全不合理,因为AI与人有一个巨大的区别就是,AI的知识与认知是可以直接复制的,就像印刷书籍一样,非常高效,但为什么仍然要通过教学这种效率极低的方式来复制AI的能力呢。

这是因为教师模型是大模型,拥有非常大的参数量,需要非常强的计算能力,计算成本非常高,但并不是所有的场景都需要如此强大的模型,教师模型好比医院的教授,他能解决治疗很多的病症,但是如果仅仅是感冒发烧也需要教授来处理的话,成本就会高得不可接受;这时大家就想到了一个办法,找来一个学生,教授向他教授基本的感冒发烧的知识与看病技巧,所有的感冒发烧病人都由他来处理,这样就可以降低患者的看病成本,提高看病效率。这里的学生就是AI里的学生模型,它只有较小的参数量,需要的计算能力和计算成本也都较低,能大大降低处理特定事项的成本并提高处理效率。虽然普通人无法学会教授那么多的专业知识与能力,但是在某些较小的方面达到或接近教授的能力,是可以实现的,所谓三个臭皮匠顶个诸葛亮,在AI中学生学习老师能力的过程称为蒸馏。

蒸馏的步骤也与人类的学生向老师学习的步骤非常相似。第一步,是准备训练数据,它包括训练样本与硬标签,所谓训练样本就是模拟训练题,硬标签就是问题答案;第二步,将模拟训练题提供给教师模型,并输出教师软标签,所谓教师软标签就是教师的解题过程;第三步,是将模拟题提供给学生模型,并输出学生软标签与学生答题结果,也就是学生的解题步骤和解题结果;第四步,是总结学生软标签与教师软标签的差异,及学生解题结果与问题硬标签的差异,也就是是总结学生解题过程与教师解题过程的差异,及学生答案与问题标准答案的差异,根据差异重新调整学生模型的解题思路,直至基本一致。这样就完成了模型的蒸馏,蒸馏就是学生将老师的某种问题的解题思路解题能力学会的过程。这和孙悟空拜师学艺异曲同工,用AI的语言就是孙悟空蒸馏了菩提祖师^_^。

http://www.dtcms.com/a/333782.html

相关文章:

  • 标注工具label-studio保姆级配置教程
  • MySQL主从集群
  • 软件开发过程中的维护活动
  • Effective C++ 条款42:了解 typename 的双重含义
  • 大模型幻觉涉及的违约责任探讨
  • Chrome插件开发全指南
  • K 近邻算法(KNN)及其应用解析
  • strings命令和findstr命令验证iso文件中ntkrnlmp.exe系统版本
  • 昇腾AI自学Day1-- 深度学习基础工具与数学
  • Lecture 9: Concurrency 2
  • AAAI爆款:目标检测新范式,模块化设计封神之作
  • fs模块_写入文件
  • 高可用双向存储服务GlusterFS
  • 【SpringBoot】SpringBoot 整合JDBC、Mybatis、Druid
  • PCA降维理论详解
  • Spring Boot 拦截器详解
  • 固定资产管理系统 OCR 识别功能技术解析
  • 无脑整合springboot2.7+nacos2.2.3+dubbo3.2.9实现远程调用及配置中心
  • 强制从不抱怨环境。
  • [Julia] 网络和流
  • vue2 + SimpleMindMap 制作思维导图
  • 野指针:程序崩溃的隐形杀手
  • 订单状态定时处理(Spring Task 定时任务)
  • 机械学习---词向量转化评价,附代码实例
  • 力扣(接雨水)——单调栈
  • 第454题.四数相加II
  • JavaWeb开发_Day12
  • 基于Selenium的web自动化框架
  • 电视同轴电缆全面指南:从基础到应用,批量测量一键计量
  • 第四章:大模型(LLM)】06.langchain原理-(2)langchain Chain的使用方法