当前位置: 首页 > news >正文

LeNet-5:手写数字识别经典CNN

配套讲解视频,点击下方名片获取

20 世纪 90 年代,计算机已经能识别文本,但图片识别很困难。比如银行支票的手写数字识别,传统方法需要人工设计规则,费时费力且精度不高。
于是,Yann LeCun 及其团队提出了 LeNet-5——一种可以自动从图片中提取特征的卷积神经网络。
1、LeNet-5 的总体思路
1.1 一个生活化比喻
想象你是一个验钞员:

  1. 拿到一张钞票(输入图片)
  2. 先用放大镜找细节(卷积层)
  3. 缩小视野,专注主要花纹(池化层)
  4. 再看更复杂的组合图案(深层卷积)
  5. 大脑分析所有线索,判断真假(全连接层 + 分类器)
    1.2 模型的三大核心步骤
  6. 特征提取(卷积层 + 池化层)
  7. 特征组合(更深的卷积)
  8. 分类决策(全连接层 + Softmax)
    [图片]

暂时无法在飞书文档外展示此内容
2、每一层的作用
2.1 C1 卷积层

  • 目标:找到低级特征(边缘、线条、简单形状)
  • 操作:6 个 5×5 滤镜,每个滤镜学会不同的模式
  • 类比:摄影师用不同滤镜拍摄同一场景,捕捉不同细节
    2.2 S2 平均池化层
  • 目标:缩小图像尺寸,保留主要信息,减少计算量
  • 类比:看缩略图——虽然小了,但主体还在
    2.3 C3 卷积层
  • 目标:组合前面的低级特征,形成高级特征(曲线、交叉)
  • 特别之处:并不是所有输入都连接到每个输出,减少参数量
    2.4 S4 平均池化层
  • 同 S2,再次降维,减少计算量
    2.5 C5 卷积层
  • 卷积核大小等于输入大小(5×5),所以每个卷积核看到整个输入
  • 相当于全连接,但参数更少
    2.6 F6 全连接层
  • 把提取到的特征重新组合,准备分类
  • 输出 84 个神经元,类似人脑做最后的综合判断
    2.7 输出层
  • Softmax 输出 10 个概率
  • 最高概率对应最终分类结果
    3、LeNet-5 的优点与局限
    3.1 优点
  • 特征自动提取
  • 参数量小(~6 万),对硬件要求低
  • 思路清晰,是现代 CNN 的模板
    3.2 局限
  • 激活函数使用 Sigmoid/tanh,训练容易梯度消失
  • 只能处理小尺寸灰度图像
  • 池化方式是平均池化(现代更常用最大池化)

4、实战项目

A285-lenets5模型实现手写数字识别实时画板手写预测


文章转载自:

http://0CkX6L73.Lmdkn.cn
http://CKVhr3EJ.Lmdkn.cn
http://TblQxoBg.Lmdkn.cn
http://rX8OPlN7.Lmdkn.cn
http://UGFYbN3Y.Lmdkn.cn
http://SUDNotXs.Lmdkn.cn
http://YntwY9Nd.Lmdkn.cn
http://K661IFol.Lmdkn.cn
http://dFlTQdjS.Lmdkn.cn
http://nWLvyd8T.Lmdkn.cn
http://4s7Tlqqq.Lmdkn.cn
http://DLKjV3iA.Lmdkn.cn
http://CxJ48AY7.Lmdkn.cn
http://LP8nP9kA.Lmdkn.cn
http://JDfibCzC.Lmdkn.cn
http://U66Lj0bD.Lmdkn.cn
http://PjBo4Z6I.Lmdkn.cn
http://ph9XmEQS.Lmdkn.cn
http://jvk6Wnu4.Lmdkn.cn
http://m7UQEOfL.Lmdkn.cn
http://rHdTJjaB.Lmdkn.cn
http://e3qUe8oU.Lmdkn.cn
http://7K424nSD.Lmdkn.cn
http://ay7K7fGt.Lmdkn.cn
http://PB1IsZS1.Lmdkn.cn
http://f8NwUpYb.Lmdkn.cn
http://28tzzu6A.Lmdkn.cn
http://qcP7jnKk.Lmdkn.cn
http://gETh5ouu.Lmdkn.cn
http://7kEHRJJO.Lmdkn.cn
http://www.dtcms.com/a/368686.html

相关文章:

  • C++ opencv RTSP小工具 RTSP流播放、每一帧保存
  • android View详解—动画
  • 2024年9月GESPC++三级真题解析(含视频)
  • ASP.NET Core文件分片上传
  • OCA、OCP、OCM傻傻分不清?Oracle认证就看这篇
  • 面试了一个外包公司,面试不到5分钟就出来,这问题问得有点变态。。。。。。
  • Matlab使用小技巧合集(系列四):Table类型高效用法与数据处理实战
  • 25高教社杯数模国赛【C题超高质量思路+可运行代码】第十弹
  • WinForms 项目里生成时选择“首选目标平台 32 位导致有些电脑在获取office word对象时获取不到
  • ANSYS 热力耦合计算
  • UE4 Mac构建编译报错 no member named “disjunction” in namespace “std”
  • 深度相机详解
  • vue 经常写的echarts图表模块结构抽取
  • 蚂蚁 S21e XP Hyd 3U 860T矿机性能分析与技术特点
  • Python迭代协议完全指南:从基础到高并发系统实现
  • CT影像寻找皮肤轮廓预处理
  • 7种流行Prompt设计模式详解:适用场景与最佳实践
  • uni-app 项目 iOS 上架踩坑经验总结 从证书到审核的避坑指南
  • 3.3_第一行之hard_local_irq_disable
  • 汽车 信息娱乐系统 概览
  • 将已有 Vue 项目通过 Electron 打包为桌面客户端的完整步骤
  • Nginx 配置片段主要用于实现​​正向代理​​,可以用来转发 HTTP 和 HTTPS 请求
  • 有鹿机器人的365天奇幻日记:我在景区当扫地僧
  • C++算法专题学习——分治
  • 智能工单路由系统(Java)
  • 生成模型实战 | 深度分层变分自编码器(Nouveau VAE,NVAE)
  • Windows多开文件夹太乱?Q-Dir四窗口同屏,拖拽文件快一倍
  • 测试驱动开发 (TDD) 与 Claude Code 的协作实践详解
  • Bug 排查日记:打造高效问题定位与解决的技术秘籍
  • MySQL InnoDB索引机制