当前位置: 首页 > news >正文

15.卷积神经网络

卷积神经网络(Convolutional Neural Network),多用于图像处理。

全连接的问题

回顾手写数字识别,我们需要将一张图片的所有像素点,展开成一个1维向量输入到网络。那么,当图片尺寸特别大时,要求的输入神经元的个数会特别大,参数多训练慢,还容易发生过拟合。除此之外,对于彩色图片而言,如果将RGB三个通道数据单纯展开铺平,会丢失空间信息。

卷积神经网络,引入卷积层,通过卷积核对图像特征进行提取,维护像素点之间的特征信息,同时也保证了参数个数不随图像尺寸变化。
经典的卷积神经网络包含:对图片进行多层卷积、池化,最后加上全连接层。在卷积和全连接的最终输出往往加上ReLu函数,有时也会引入Dropout防止过拟合。

卷积核

卷积核(kernel),又称滤波器(filter)
卷积运算,是通过卷积核在图片上移动,计算点乘求和得到的。注意,卷积往往在计算结束后还会加偏置项(bias),一个卷积核对应一个偏置项。在卷积层部分训练学习的,也就是机器调整的,就是卷积核和偏置项。

在这里插入图片描述
假设偏置项为1,计算结果如下:
在这里插入图片描述

多通道彩色图片

对于多通道彩色图片,根据需求,有单输出和多输出两种情况。
单输出,用一组卷积核计算
在这里插入图片描述
多输出,用多组卷积核计算
在这里插入图片描述
在这里插入图片描述

批量操作

在网络训练时,往往将小批量的多张图片同时进行训练,输入图片维度为:
在这里插入图片描述
假设输入2张3x3的三通道彩色图片,其形状为(2,3,3,3)

感受野

我们的图片经过卷积后,尺寸会变小,那么,卷积后的点,对应原图中的区域大小,我们称作感受野(Receptive Filed)
在这里插入图片描述
经过两次3x3的卷积后,感受野会变为5x5
在这里插入图片描述

边缘填充

边缘填充(Padding),在卷积的过程中,由于尺寸不足或尺寸保持,我们需要对图片的尺寸进行补充,这个过程叫边缘填充。
填充可以填充0、临近值等等。不进行填充(VALID),尺寸保持填充(SAME)
卷积核大小一般为1,3,5,7等奇数,如果在这里插入图片描述
那么经过卷积后,图片尺寸保持不变

在这里插入图片描述
卷积后尺寸计算公式,stride步长,指的是每次计算移动的距离
在这里插入图片描述

池化

池化(pooling或subsampling),特征提取,降低尺寸。尺寸减半,通道数不变
在这里插入图片描述

在这里插入图片描述

http://www.dtcms.com/a/329524.html

相关文章:

  • 图像分割-动手学计算机视觉9
  • ZED 2i相机调试
  • 以鼠标位置为中心进行滚动缩放
  • CSS counter-reset 与 counter-increment:用 CSS 实现自动编号的黑科技
  • 【日常学习】2025-8-13
  • HTML <iframe> 标签 如何把html写入iframe标签
  • 更友好的并发库conc介绍
  • 七猫免费小说
  • 【117页PPT】企业数字化转型物流信息化咨询项目规划方案(附下载方式)
  • day20
  • Qwen-Image(阿里通义千问)技术浅析(二)
  • GDB命令笔记
  • Windows也能用!Claude Code硬核指南
  • 2021 年全国硕士研究生招生考试真题笔记
  • 基于DDPG的车辆纵向速度控制优化:兼顾速度与乘坐舒适性
  • React UI 框架
  • Vue3 使用 echarts 甘特图(GanttChart)
  • 【(一)页面布局】
  • 海康视觉平台VM创建项目
  • JAVA实战小项目——输入验证码
  • rtmp 推流
  • 浅层神经网络
  • Dimensional Analysis量纲分析入门
  • 猫粮哪个牌子质量好性价比高?2025适合幼猫的猫粮推荐
  • LangGraph 指南篇-基础控制
  • GaussDB 动态内存过高处理办法
  • 从表单校验到API网关:全链路输入安全防护指南
  • SeaTunnel MCP Server 入选《中国信通院开源商业产品及企业典型案例集(2025)》
  • 开源日志log4cplus—如何将 string类型转为tstring类型,又如何将char*类型转换为tstring类型?
  • 机器学习入门:核心概念详解与Python示例代码