当前位置: 首页 > wzjs >正文

免费网站收录中国北京出啥大事了

免费网站收录,中国北京出啥大事了,做电子商城网站,我的世界皮肤做壁纸的网站深度学习自2012年的AlexNet发展以来已经从早期的各自为战,发展到现在的预训练大模型大小联调(迁移学习)。 迁移学习 那么在神经网络的训练上,是否也有这种现象呢? 答案是肯定的,目前CNN领域一般在一个已经…

深度学习自2012年的AlexNet发展以来已经从早期的各自为战,发展到现在的预训练大模型+大小联调(迁移学习)。

迁移学习

在这里插入图片描述
那么在神经网络的训练上,是否也有这种现象呢?
答案是肯定的,目前CNN领域一般在一个已经训练好的预训练模型上根据具体任务再进行微调。

迁移学习放宽了训练数据必须与测试数据独立同分布的假设

因为这种方法侧重的是知识迁移和领域适应,并不依赖于数据的统计特性。

优势

在这里插入图片描述

实现

在这里插入图片描述

微调

微调的核心思想是利用在大规模数据集上预训练一个模型,然后在基于少量的目标域训练样本上对预训练模型的参数进行微调。这种方法在解决小样本应用场景中展现出巨大的潜力。
在这里插入图片描述
在VGG中就有过类似的使用:
在这里插入图片描述
浅层的A层作为预训练,初始化其他模型的参数

微调的几种方式

  • 载入预训练模型后,微调训练所有层的参数
  • 载入预训练模型后, 固定(冻结)前面的卷积层,只训练最后几个全连接层的参数
  • 载入预训练模型后,微调后面的卷积层 + 全连接层

微调 (fine-tuning) 应用场景

在这里插入图片描述

知识蒸馏

让小模型获得大模型的智慧
小模型有部署简单,资源消耗小等优点。

什么是知识蒸馏

将大模型的知识迁移到小模型当中,让小模型模仿大模型

实现

使用软标签

什么是软标签?
在这里插入图片描述
软标签可以保留更多信息,适合作为小模型学习的材料

损失函数

教师在将“知识”传递给学生的过程中,会有一些损失,称为蒸馏损失

因此,学生模型的损失由两部分构成:
总损失 = 蒸馏损失 + 自身模型损失 的加权和

过程

在这里插入图片描述
温度控制
在这里插入图片描述
在softmax中会将占比大的类别会更大,占比小的会更小。也就是说softmax会增大个个选项之间的差距。
而在指数函数中自变量越小,增长的幅度越小,因此可以增大温度来控制各个选项的差距。
在这里插入图片描述

http://www.dtcms.com/wzjs/310511.html

相关文章:

  • 网站建设流程步骤怎么样佛山旺道seo优化
  • 网站登录接口怎么做关键词排名快照优化
  • 沈阳世纪兴网站建设微商已经被国家定为传销了
  • 99到家网站怎么做网络推广项目计划书
  • 网站 后台 数据 下载站长之家素材网
  • 网站的优点缺点公众号代运营
  • 淮北网站建设推广百度公司注册地址在哪里
  • wordpress 健身预约沧州网站seo
  • 专业网页网站设计图书南宁百度seo优化
  • 建湖做网站资源优化网站排名
  • 深圳有做公司网站深圳网站优化网站
  • 网站建设的一般过程网页设计用什么软件
  • 做传销一般是不是有网站企业品牌推广网站
  • 建设银行信用卡卡网站首页线下推广
  • 建设 信用中国 网站制作网页模板
  • 河北省建设执业资格中心网站seo怎么发外链的
  • 网站用空间还是服务器关键词录入榜
  • 布谷海南网站建设免费二级域名注册网站
  • 院系网站建设宁德市古田县
  • win10电脑做网站怀化网络推广
  • dz论坛做分类网站网上宣传方法有哪些
  • wordpress应用市场主体谷歌seo 外贸建站
  • 织梦模板网站电商网站开发需要多少钱
  • 做视频网站每部电影都要版权游戏代理怎么找渠道
  • 建设本地端网站茶叶营销策划方案
  • 智能网站建设软件有哪些方面贵州seo技术查询
  • 医院网站建设情况百度客户服务电话是多少
  • 网站建设需要注意哪些细节企业推广宣传方案
  • 网站制作价格东莞360建站系统
  • 泉州做网站哪家好优化网站打开速度