当前位置: 首页 > news >正文

LeNet-5卷积神经网络详解

LeNet-5卷积神经网络详解

1. 历史背景

LeNet-5是由Yann LeCun等人在1998年提出的一种卷积神经网络架构,是深度学习领域的一个重要里程碑。这个网络最初是为了解决手写数字识别问题而设计的,在当时取得了突破性的成果。它的成功不仅证明了卷积神经网络在计算机视觉任务中的有效性,更为后来深度学习的发展奠定了重要基础。

在这里插入图片描述

图1:LeNet-5网络结构示意图

2. 网络结构

LeNet-5的结构非常优雅且富有洞见,它包含了现代卷积神经网络的基本组成部分:

2.1 输入层

  • 输入:32×32像素的灰度图像
  • 说明:选择这个尺寸是为了保证在多次卷积和池化操作后,特征图仍有足够的空间信息

2.2 第一卷积层(C1)

  • 卷积核:6个5×5的卷积核
  • 输出:28×28×6的特征图
  • 作用:提取基本的视觉特征,如边缘、线条等

2.3 第一池化层(S2)

  • 类型:2×2最大池化
  • 输出:14×14×6的特征图
  • 作用:压缩数据的同时保留重要特征,提高模型的平移不变性

2.4 第二卷积层(C3)

  • 卷积核:16个5×5的卷积核
  • 输出:10×10×16的特征图
  • 作用:组合低层特征,形成更复杂的特征模式

2.5 第二池化层(S4)

  • 类型:2×2最大池化
  • 输出:5×5×16的特征图
  • 作用:进一步降维,提取最显著的特征

2.6 全连接层(F5、F6)

  • F5:120个神经元
  • F6:84个神经元
  • 输出层:10个神经元(对应10个类别)

2.7 数据流转过程

输入图像(32×32) → C1卷积层(28×28×6) → S2池化层(14×14×6) → C3卷积层(10×10×16) → S4池化层(5×5×16) → 展平(400) → F5全连接层(120) → F6全连接层(84) → 输出层(10)

3. 工作原理

3.1 特征提取过程

  1. 局部感知

    • 卷积层通过滑动窗口方式,每次只关注图像的一小部分区域
    • 这种设计模仿了人类视觉系统的特点,更加高效且有效
  2. 特征层次

    • 浅层网络提取简单特征(边缘、纹理)
    • 深层网络组合简单特征,形成复杂特征(形状、结构)
  3. 权重共享

    • 同一个卷积核在整个图像上共享权重
    • 大大减少了模型参数数量,提高训练效率

3.2 创新点

  1. 层次化设计

    • 卷积层和池化层交替使用的设计模式
    • 这种结构被后来的众多网络所采用
  2. 特征提取与分类的分离

    • 卷积和池化层负责特征提取
    • 全连接层负责最终的分类决策

4. PyTorch实现

以下是使用PyTorch框架实现LeNet-5网络的代码示例:

import torch
import torch.nn as nn

class Lenet5(nn.Module):
    '''LeNet-5网络实现'''
    def __init__(self):
        super(Lenet5, self).__init__()
        # 第一个卷积层:输入1通道,输出6通道,5×5卷积核
        self.conv2d1 = nn.Conv2d(in_channels=1, out_channels=6, kernel_size=5, stride=1, padding

相关文章:

  • 【python】如何判断是json数组还是字典
  • c++介绍线程的屏障 八
  • nnUNet V2修改网络——全配置替换MultiResBlock模块
  • 密码学笔记
  • springboot 自动装配原理
  • 用户模块——redis工具类
  • 04 | 初始化 fastgo 项目仓库
  • tcp/ip协议中网络层协议的主要特点,tcp/ip协议中网络层都有哪些协议?
  • c# 2025/3/12 周三
  • MyBatis 的核心配置文件是干什么的? 它的结构是怎样的? 哪些是必须配置的,哪些是可选的?
  • AI重构SEO关键词布局
  • TA学习之路——1.4 MVP矩阵运算
  • 安全左移动赋能:灵脉IAST交互式应用安全测试平台
  • Python的日志
  • HarmonyOS学习第19天:感知世界的 “超能力”,HarmonyOS 传感器揭秘
  • ChātGPT开发“SolidWorks工具箱”,可建海量3D模型库,能一键画图、批量赋属性、自动出图,效率提高10倍
  • 浅拷贝和深拷贝AI
  • 复试数据库原理总结
  • Unity3D网格简化与LOD技术详解
  • Linux 内核文件读取与内存映射管理机制的理解心得
  • 车展之战:国产狂飙、外资反扑、智驾变辅助
  • 耶路撒冷发生山火,以防长宣布紧急状态
  • 剑指3000亿产业规模,机器人“武林大会”背后的无锡“野望”
  • 十二届上海市委第六轮巡视全面进驻,巡视组联系方式公布
  • 全国人民代表大会常务委员会公告〔十四届〕第十号
  • 孕妇乘坐高铁突发临产,广西铁路部门协助送医平安产子