当前位置: 首页 > wzjs >正文

wordpress开发者模式北京seo方法

wordpress开发者模式,北京seo方法,网站网页设计招聘,找人做网站注意什么问题深度学习自2012年的AlexNet发展以来已经从早期的各自为战,发展到现在的预训练大模型大小联调(迁移学习)。 迁移学习 那么在神经网络的训练上,是否也有这种现象呢? 答案是肯定的,目前CNN领域一般在一个已经…

深度学习自2012年的AlexNet发展以来已经从早期的各自为战,发展到现在的预训练大模型+大小联调(迁移学习)。

迁移学习

在这里插入图片描述
那么在神经网络的训练上,是否也有这种现象呢?
答案是肯定的,目前CNN领域一般在一个已经训练好的预训练模型上根据具体任务再进行微调。

迁移学习放宽了训练数据必须与测试数据独立同分布的假设

因为这种方法侧重的是知识迁移和领域适应,并不依赖于数据的统计特性。

优势

在这里插入图片描述

实现

在这里插入图片描述

微调

微调的核心思想是利用在大规模数据集上预训练一个模型,然后在基于少量的目标域训练样本上对预训练模型的参数进行微调。这种方法在解决小样本应用场景中展现出巨大的潜力。
在这里插入图片描述
在VGG中就有过类似的使用:
在这里插入图片描述
浅层的A层作为预训练,初始化其他模型的参数

微调的几种方式

  • 载入预训练模型后,微调训练所有层的参数
  • 载入预训练模型后, 固定(冻结)前面的卷积层,只训练最后几个全连接层的参数
  • 载入预训练模型后,微调后面的卷积层 + 全连接层

微调 (fine-tuning) 应用场景

在这里插入图片描述

知识蒸馏

让小模型获得大模型的智慧
小模型有部署简单,资源消耗小等优点。

什么是知识蒸馏

将大模型的知识迁移到小模型当中,让小模型模仿大模型

实现

使用软标签

什么是软标签?
在这里插入图片描述
软标签可以保留更多信息,适合作为小模型学习的材料

损失函数

教师在将“知识”传递给学生的过程中,会有一些损失,称为蒸馏损失

因此,学生模型的损失由两部分构成:
总损失 = 蒸馏损失 + 自身模型损失 的加权和

过程

在这里插入图片描述
温度控制
在这里插入图片描述
在softmax中会将占比大的类别会更大,占比小的会更小。也就是说softmax会增大个个选项之间的差距。
而在指数函数中自变量越小,增长的幅度越小,因此可以增大温度来控制各个选项的差距。
在这里插入图片描述

http://www.dtcms.com/wzjs/465682.html

相关文章:

  • 建筑信息平台查询google优化推广
  • 网站素材模板seo顾问公司
  • 对日网站开发新闻头条最新消息今天发布
  • 婚礼网站怎么做环球军事网最新军事新闻最新消息
  • 厦门英文网站建设如何修改百度上面的门店号码
  • 网站内容建设要求 age06社交网络的推广方法
  • 做创新方法工作网站百度竞价排名官网
  • 述职报告ppt免费模板下载厦门seo优
  • wordpress如何制作网站seo销售是做什么的
  • 搭建免费网站北京搜索引擎优化
  • 网站需备案吗seo搜索引擎优化就业指导
  • 网站建设投入产出分析seo免费自学的网站
  • 如何做好市场营销seo管理与优化期末试题
  • c 网站开发案例详解电商平台怎么推广
  • wordpress百度抓取温州seo教程
  • 做任务的奖金网站小学生简短小新闻十条
  • java动态网站建设视频2023年新闻小学生摘抄
  • 网站建设的 文献综述培训计划和培训内容
  • 云南省建设考试中心网站网络营销的方式有几种
  • 网站建设标书模板关键词诊断优化全部关键词
  • 网站建设与管理ppt富阳网站seo价格
  • 政府力推企业做网站公司网站建设哪个好
  • 机械模板网站电子商务网站建设与管理
  • 济源制作网站windows优化大师要会员
  • 男女做那个的小视频网站站长seo查询工具
  • 织梦的网站收录不好百度打广告收费表
  • 如何做商城网站郑州seo哪家好
  • 网站模版购买seo排名优化点击软件有哪些
  • 福田做网站公司百度推广怎么开户
  • 徐州 商城网站建设网站关键词排名优化工具