当前位置: 首页 > news >正文

深度学习入门(十三):加深网络

首先要认识一点,深度学习是加深了层的深度神经网络。

加深网络

首先回顾前面,我们了解了构成神经网络的各种层、学习时的有效方法、对图像特别有效的CNN、参数的最优化方法等。这些都是深度学习中的重要技术。

更深层的网络

在这里插入图片描述
如图所示的是一个CNN,但是它比之前的所有网络都要深。这里使用的卷积层是3X3的小型滤波器,特点是随着层的加深,通道数变大。此外,插入了池化层,以逐渐减小中间数据的空间大小;并且后面的全连接层中使用了Dropout层。
这个网络使用He初始值作为权重的初始值,使用Adam更新权重参数。因此总共具有以下特点:

• 基于3×3的小型滤波器的卷积层。
• 激活函数是ReLU。
• 全连接层的后面使用Dropout层。
• 基于Adam的最优化。
• 使用He初始值作为权重初始值。

所以可以说这是一个加深的神经网络,使用了多个之前提到的技术。这个网络的识别精度高达99%,只有在极其严苛的情况下才会识别失败,连人眼也无法识别出。也就是说,这样经过训练的神经网络可以达到和人眼识别近似一样的效果,因此可以说存在巨大的可能性。

进一步提高识别精度

对于MNIST数据集,层不用特别深就获得了(目前)最高的识别精度。一般认为,这是因为对于手写数字识别这样一个比较简单的任务,没有必要将网络的表现力提高到那么高的程度。因此,可以说加深层的好处并不大。

集成学习、学习率衰减、Data Augmentation(数据扩充)等都有助于提高识别精度。尤其是数据扩充,方法简单而效果显著。
Data Augmentation基于算法“人为地”扩充输入图像(训练图像)。具体地说,如图所示,对于输入图像,通过施加旋转、垂直或水平方向上的移动等微小变化,增加图像的数量。这在数据集图像数量有限时尤其有效。
在这里插入图片描述
除了如图所示的变形之外,Data Augmentation还可以通过其他各种方法扩充图像,比如裁剪图像的 “crop处理”、将图像左右翻转的“flip 处理”(只在不需要考虑图像对称性的情况下有效)等。
对于一般的图像,施加亮度等外观上的变化、放大缩小等尺度上的变化也是有效的。

加深层的动机

加深层的重要性理论研究还不够透彻。但是有几点可以从过往的研究和实验中得以解释(虽然有一些直观)。
首先,从以ILSVRC为代表的大规模图像识别的比赛结果中可以看出加深层的重要性,因为从前几名看,他们的方法多是基于深度学习的,并且有逐渐加深网络的层的趋势。也就是说,可以看到层越深,识别性能也越好。
加深层的一个好处是可以减少网络的参数数量。与没有加深层的网络相比,加深了层的网络可以用更少的参数达到同等水平(或者更强)的表现力。
在这里插入图片描述
如图示是5X5卷积的例子
在这里插入图片描述
如图是两次重复3X3卷积的例子。
明显可以看到:一次5×5的卷积运算的区域可以由两次3×3的卷积运算抵充。并且,相对于前者的参数数量25(5×5),后者一共是18(2×3×3),通过叠加卷积层,参数数量减少了。而且,这个参数数量之差会随着层的加深而变大。

加深层的另一个好处就是使学习更加高效。与没有加深层的网络相比,通过加深层,可以减少学习数据,从而高效地进行学习。具体地说,在前面的卷积层中,神经元会对边缘等简单的形状有响应,随着层的加深,开始对纹理、物体部件等更加复杂的东西有响应。
通过加深网络,就可以分层次地分解需要学习的问题。因此,各层需要学习的问题就变成了更简单的问题。
通过加深层,可以分层次地传递信息,这一点也很重要。

这里需要注意的是,近几年的深层化是由大数据、计算能力等即便加深层也能正确地进行学习的新技术和环境支撑的。

相关文章:

  • Linux Docker 安装oracle19c数据库教程
  • 【算法提升】牛牛冲钻五 最长无重复子数组 重排字符串 one_day
  • 热点数据的统计到应用
  • 【Sqoop基础】Sqoop定位:关系型数据库与Hadoop生态间的高效数据桥梁
  • RabbitMQ 集群与高可用方案设计(三)
  • 如何用AI设计LOGO,DeepSeek+豆包免费批量生成
  • 【图论 并集查找】P3671 [USACO17OPEN] Where‘s Bessie? S|普及+
  • CodeGeeX - AI编程助手
  • Java Swing 自定义JOptionPane
  • 【文本分类】KG-HTC 知识图谱提升分类准确率
  • 有铜半孔工艺的制造难点与工艺优化
  • 2025年绿色材料与制造技术国际学术会议(GMMT 2025)
  • 易境通WMS系统:赋能快消品海外仓高效管理
  • 《数字图像处理(面向新工科的电工电子信息基础课程系列教材)》第三次印刷
  • leetcode617.合并二叉树:迭代法中层序遍历与队列操作的深度解析
  • 7.安卓逆向2-frida hook技术-介绍
  • Real2Render2Real:无需动力学仿真或机器人硬件即可扩展机器人数据
  • gin使用Mysql连接池用法
  • 【排错】kylinLinx环境python读json文件报错UTF-8 BOM
  • Linux三剑客之grep命令使用教程
  • 网站后台怎么这么卡/宁波正规seo推广公司
  • 南京高端网站建设公司/googleseo优化
  • 怎么登录企业邮箱/seo是什么岗位简称
  • 17岁日本免费完整版观看/厦门seo公司到1火星
  • 做的网站上传到服务器吗/良品铺子网络营销策划书
  • 维吾尔网站建设学术/google play官网下载