当前位置: 首页 > news >正文

机器学习第二十三讲:CNN → 用放大镜局部观察图片特征层层传递

机器学习第二十三讲:CNN → 用放大镜局部观察图片特征层层传递

资料取自《零基础学机器学习》。
查看总目录:学习大纲

关于DeepSeek本地部署指南可以看下我之前写的文章:DeepSeek R1本地与线上满血版部署:超详细手把手指南


CNN详解:图像理解的多层放大镜[^9-2]

卷积神经网络(CNN)就像给计算机装备了显微镜+望远镜的组合套装,通过逐层放大观察图像特征。以"识别橘猫图片"为例:

识别边缘轮廓
捕捉橘色条纹
输入图片
初级特征放大镜
中级特征望远镜
高级特征显微镜
橘猫!
一、核心原理(图像分析实验)

三层观察流程

  1. 局部扫描(3×3小窗口):
    猫耳边缘 = [[0.1, 0.8, 0.1],[0.7, 0.9, 0.6],[0.2, 0.7, 0.3]
    ]
    # 卷积核检测垂直接缝[^9-2]
    
  2. 特征抽象(最大池化):
    原图特征
    2x2网格中取最大值
    保留橘纹走向
  3. 全盘整合(全连接层):
    特征维度典型值说明
    绒毛密度0.87超过短毛猫阈值
    条纹间距0.65典型橘猫模式
    瞳孔形状0.92符合猫科特征

    判断输出:综合特征置信度达到93%[^9-2]

二、关键技术解析(智能修图软件案例)

三大核心装备

  1. 卷积核滤镜组 → PS软件的边缘检测工具

    • 横向梯度核:[[-1,0,1], [-2,0,2], [-1,0,1]]
    • 纵向梯度核:[[-1,-2,-1], [0,0,0], [1,2,1]]
    原图边缘 = 图片矩阵 * 卷积核  # 矩阵点积操作[^2-1]
    
  2. 池化压缩机 → 画作缩略图生成器

    • 最大池化:保留最明显的笔触特征
    • 平均池化:融合背景色调信息[^9-2]
  3. 激活函数开关 → 智能画笔压力感应

    传统画笔
    线性涂抹
    扁平化效果
    ReLU激活
    保留阳刻线条
    ^9-2
三、应用实例解析(自动驾驶视觉系统)

六层卷积网络实战

摄像头画面
车道线检测层
关键点保留
交通牌识别层
符号定位
行人轮廓层
紧急制动决策

参数实例

  • 训练数据:200万张道路图片
  • 卷积核数量:32→64→128通道递增
  • 准确率提升:从初训67%到精调98%[^10-1]
四、与传统网络对比(艺术生vs工程师画像)
对比维度全连接网络CNN[参考材料4]
观察方式整张画同时看按区域局部扫描效率提升20倍
参数数量1000x1000图片需10亿参数同尺寸图片仅百万参数内存占用减少90%
特征提取像素级记忆空间模式抽象抗干扰能力提升35%
训练时间实例MNIST数据集30分钟/10 epoch同任务3分钟/10 epoch[^9-2]速度提升10倍
五、调参要点(摄影爱好者进阶指南)

三档参数调节

  1. 卷积核尺寸 → 更换镜头焦距

    • 3x3:标配镜头(平衡细节与速度)
    • 5x5:长焦镜头(捕捉细致纹理)
    • 7x7:广角镜头(获取全局信息)[^9-2]
  2. 通道数设置 → 调整胶片感光层

    model.add(Conv2D(filters=64,  # 64种特征探测器kernel_size=(3,3),activation='relu'
    ))
    
  3. 步长与填充 → 控制取景节奏

    2,2
    快速采样
    可能丢失细节
    1,1
    精细扫描
    增加计算量
    Same填充
    保留边缘信息
    ^9-2

典型训练效果

训练曲线:
Epoch 5/20 - acc: 0.82 → Epoch 15/20 - acc: 0.96
验证集表现: 
AUC = 0.97 优于传统算法0.85[^10-2]

目录:总目录
上篇文章:机器学习第二十二讲:感知机 → 模仿大脑神经元的开关系统


[^2-1]《零基础学机器学习》第二章第一节矩阵运算
[^9-2]《零基础学机器学习》第九章第二节CNN原理
[^10-1]《零基础学机器学习》第十章第一节项目实战
[^10-2]《零基础学机器学习》第十章第四节竞赛指导


文章转载自:

http://ntbnfprf.gwdkg.cn
http://vkxDiuHp.gwdkg.cn
http://txQKpG8L.gwdkg.cn
http://Zlx7ibW2.gwdkg.cn
http://1rQx25tp.gwdkg.cn
http://OYqutURS.gwdkg.cn
http://9cqeC0td.gwdkg.cn
http://R8YR5Yqg.gwdkg.cn
http://F1aY49IY.gwdkg.cn
http://Wgm76O1l.gwdkg.cn
http://ZE15emHS.gwdkg.cn
http://d1H0NvV0.gwdkg.cn
http://GyM4cjAu.gwdkg.cn
http://l9kmGP0o.gwdkg.cn
http://ELlr3mm3.gwdkg.cn
http://t6J4eST0.gwdkg.cn
http://6W1bgYx8.gwdkg.cn
http://wD5DNcQw.gwdkg.cn
http://nY5RgwUV.gwdkg.cn
http://h1plZqze.gwdkg.cn
http://dPFaBsxA.gwdkg.cn
http://trxjemG6.gwdkg.cn
http://mTTRel9z.gwdkg.cn
http://0RC7o8s0.gwdkg.cn
http://3OZmL7xH.gwdkg.cn
http://2jk5gsBo.gwdkg.cn
http://0t6hX7a2.gwdkg.cn
http://8Fs7v2nK.gwdkg.cn
http://qw9AUnY5.gwdkg.cn
http://URXoqU78.gwdkg.cn
http://www.dtcms.com/a/206814.html

相关文章:

  • 第五章:异步幻境 · 时间与数据的秘密
  • 探秘 OneCode 双向转换引擎:数据双向流动的核心驱动力
  • 精益数据分析(78/126):问题-解决方案画布的实战应用与黏性阶段关键总结
  • ObservableCollection序列化,和监听链表内元素变化
  • 【Java】—— 常见的排序算法
  • Modelsim的入门使用和Verilog编写
  • 在 Ubuntu 24.04 LTS 上 Docker 部署 DB-GPT
  • 汇舟问卷:国外问卷调查如何闭坑
  • 【RocketMQ 生产者和消费者】- 生产者启动源码-启动流程(1)
  • 选新手机的参考:CPU型号、内存、外存、屏幕、摄像头以及电池等。
  • 如何测试JWT的安全性:全面防御JSON Web Token的安全漏洞
  • AI Agent开发第73课-预训练qwen3-如何加入自己的语料
  • ElasticSearch操作
  • 边缘计算是什么?逻辑视域下的边缘计算:分布式计算范式的理论基础与逻辑结构分析
  • 二分算法的补充说明
  • TMP1827认证流程
  • 从法律视角看湖北理元理律师事务所的债务优化实践
  • 数据结构与算法-线性表-双向链表(Double Linked List)
  • C++ 中的 **常变量** 与 **宏变量** 比较
  • 25.5.22学习总结
  • window 显示驱动开发-指定 GDI 硬件加速渲染操作
  • Python-标准库
  • 浅谈测试驱动开发TDD
  • 微服务架构的演变过程
  • 关于大语言模型的问答?
  • spring boot启动报错:2002 - Can‘t connect to server on ‘192.168.10.212‘ (10061)
  • 咬合配准算法文献推荐
  • 电子电路:为什么会产生电流超前或者滞后于电压的情况?
  • CUDA 加速的稀疏矩阵计算库cuSPARSE
  • 数据库blog5_数据库软件架构介绍(以Mysql为例)