当前位置：首页 > news >正文

深度学习13（经典卷积网络结构+卷积网络结构优化）

news 2025/11/7 16:23:53

简单看一下卷积网络发展历史

LeNet-5解析

激活层默认不画网络图当中，这个网络结构当时使用的是sigmoid和Tanh函数，还没有出现Relu函数。将卷积、激活、池化视作一层，即使池化没有参数。

下面从计算角度分析一下

输入层input	输入32 * 32 * 3 32 × 32：图像的高度和宽度 3：RGB三个颜色通道
卷积层Conv1	输入（接收）：32 * 32 * 3 参数：卷积核大小：55 卷积核数量：6 步长：1 输出：28 28 * 6
池化层Pool1	输入（接收）：28 * 28 * 6 参数：卷积核大小：2 * 2 步长：1 输出：14 * 14 * 6
卷积层Conv2	输入（接收）：14 * 14 * 6 参数：卷积核大小：55 卷积核数量：16 步长：1 输出：10 10 * 16
池化层Pool2	输入（接收）：10 * 10 * 16 参数：卷积核大小：2 * 2 步长：2 输出：5 * 5 * 16
全连接层FC3	神经元个数：120
全连接层FC4	神经元个数：84
输出层output	使用softmax激活函数

AlexNet介绍

2012年，Alex Krizhevsky、llya Sutskever在多伦多大学Geoff Hinton的实验室设计出了一个深层的卷积神经网络AlexNet，夺得了2012年ImageNetLSVRC的冠军，且准确率远超第二名(其错误率为15.3%，第二名为26.2%)，引起了很大的轰动。AlexNet可以说是具有历史意义的一个网络结构。

总参数量:60M=6000万，5层卷积+3层全连接
使用了非线性激活函数:ReLU
防止过拟合的方法:Dropout，数据扩充(Dataaugmentation)
批标准化层的使用

GoogleNet简单了解

GoogleNet，2014年比赛冠军的model，这个model证明了一件事:用更多的卷积，更深的层次可以得到更好的结构。(当然，它并没有证明浅的层次不能达到这样的效果)。

其使用了多层Inception结构，使得参数较少，当时面对500万的参数量计算也能较快。

结构优化：Inception 结构

首先我们要说一下在Networkin Network中引入的1x1卷积结构的相关作用

1x1卷积

从图中，看到1x1卷积的过程，那么这里先假设只有3个1x1Fiter，那么最终结果还56x56x3。但是每一个Flter的三个参数的作用。看作是对三个通道进行了线性组合，我们甚至可以把这几个Fllter可以看成就是一个简单的神经元结构，每个神经元参数数量与前面的通道数量相等。

特点
1、多个1x1的卷积核级联加上配合激活函数，将feature map由多通道的线性组合变为非线性组合。(信息整合)，提高特征抽象能力(MultilayerPerceptron,缩写MLR,就是一个多层神经网络)
2、1x1的卷积核操作还可以实现卷积核通道数的降维和升维，实现参数的减小化