当前位置: 首页 > news >正文

卷积神经网络CNN(一):卷积操作

卷积神经网络 (CNN) 是一种特殊的深度学习模型,特别擅长处理具有网格状拓扑结构的数据,如图像(2D网格)、视频(3D网格)或时间序列(1D网格)。CNN之所以高效且强大,关键在于其卷积层 (Convolutional Layer) 中执行的卷积操作 (Convolution Operation)

核心原理:特征提取与局部感知

在传统的全连接神经网络中,每个神经元都连接到前一层的所有神经元。对于高分辨率图像,这会导致参数量巨大,难以训练,并且模型无法很好地捕捉图像的空间结构信息。

卷积操作借鉴了生物学的视觉皮层机制

  • 局部感知域 (Local Receptive Field): 视皮层中的单个神经元只对视野中有限区域内的刺激做出反应。在CNN中,这意味着一个输出特征图上的神经元只与输入数据(如图像)的一个局部区域相连接。
  • 特征提取: 卷积操作通过一种称为滤波器 (Filter)卷积核 (Kernel) 的小矩阵,在输入数据上滑动并进行计算,从而自动提取局部特征,例如边缘、纹理、颜色等。

卷积操作的机制与数学本质

互相关运算 (Cross-Correlation)

在深度学习的卷积层中,实际执行的数学运算通常是互相关 (Cross-Correlation),而非严格意义上的数学卷积。但习惯上仍将其称为“卷积操作”。

在这里插入图片描述

步骤分解:

  1. 定义滤波器(卷积核): 这是一个可学习的小矩阵,例如 3×3 或 5×5。每个滤波器旨在识别输入中的特定特征
  2. 滑动 (Sliding): 滤波器从输入数据的左上角开始,以预定的步幅 (Stride) 向右、向下“滑动”。
  3. 逐元素乘积与求和 (Element-wise Multiplication and Summation): 在滤波器的每个位置,它与输入数据中被覆盖的局部区域进行逐元素相乘,然后将所有乘积相加
  4. 偏置项与激活函数: 将求和结果加上一个偏置项 b(Bias),然后通常通过一个非线性激活函数(如ReLU)进行处理,得到输出特征图的一个像素值。
  5. 形成特征图 (Feature Map): 重复上述步骤,直到滤波器遍历整个输入图像,从而生成一个二维输出矩阵,即特征图 (Activation Map)。这个特征图表示了输入中对应特征被检测到的位置和强度。

关键超参数

卷积操作的行为由几个关键的超参数 (Hyperparameters) 控制:

超参数描述作用
滤波器尺寸卷积核的宽度和高度(如 3×3)。决定了局部感知域的大小,即每次观察输入数据的范围。
通道数滤波器(卷积核)的深度,必须与输入数据的通道数相同。对于彩色图像(RGB),输入通道数为3。
滤波器数量一个卷积层中使用的卷积核总数。每个滤波器学习提取一种不同的特征。滤波器数量决定了输出特征图的深度
步幅 (Stride)滤波器在输入上每次滑动的像素距离(通常是1或2)。决定了特征图的尺寸。步幅越大,特征图尺寸越小。
填充 (Padding)在输入数据的边界周围添加额外的零值像素。主要用于控制特征图的空间尺寸,最常见的是**“保持尺寸”填充 (Same Padding)**,使输出尺寸与输入尺寸相同。

卷积操作的两大重要特性

卷积操作引入了两个核心特性,使CNN在处理图像数据时具有显著优势:

参数共享 (Parameter Sharing)

  • 概念: 同一个卷积核(滤波器)在整个输入图像的不同位置上使用相同的权重和偏置。
  • 优势:
    • 减少参数量: 极大地减少了模型中可训练参数的数量。例如,一个 3×3 的滤波器无论输入图像有多大,都只有9个权重(加上1个偏置),这使得模型更易于训练,并减少了过拟合的风险。
    • 平移等变性/不变性 (Translation Equivariance/Invariance): 如果一个特征(例如一条边)出现在图像的某个位置,使用相同的滤波器也能在图像的另一个位置检测到它。这种平移等变性是CNN的核心优势之一。

稀疏连接/局部连接 (Sparse Connectivity / Local Connectivity)

  • 概念: 输出特征图中的一个神经元只与输入数据的局部感知域相连,而不是与所有输入神经元相连。
  • 优势:
    • 高效计算: 减少了每层之间的连接数量,使计算更加高效。
    • 关注局部特征: 强制模型首先学习局部、低级的特征(如边缘),然后在更深的层中将这些局部特征组合成更复杂、更高级的特征(如眼睛、轮子)。

卷积操作在CNN架构中的作用

卷积操作是CNN的特征提取器,通常与非线性激活层(如ReLU)和池化层 (Pooling Layer) 配合使用,形成卷积块 (Convolutional Block)

  1. 初级特征提取: 在网络的浅层,卷积核学习提取简单的、通用的特征,如水平/垂直边缘。
  2. 高级特征提取: 随着网络的加深,后续的卷积层在前一层特征图的基础上进行操作。这些深层卷积核通过组合前一层的简单特征,学习提取越来越复杂和抽象的特征,例如物体的形状、部分甚至整个物体。
  3. 通道融合: 通过多输出通道(即使用多个滤波器),卷积操作还能在不同特征通道之间进行信息融合和抽象。例如,1×1 卷积可以视为一种跨通道的特征融合与降维/升维手段。

总结

卷积操作的本质是一种空间过滤器。它通过学习一组最优的、可共享的权重(即卷积核),有效地将原始高维输入数据(如图像像素)抽象压缩转化为更有意义、更具判别力的特征表示(即特征图),为后续的全连接分类器提供高质量的输入。正是这种强大的特征学习能力,使CNN成为现代计算机视觉任务的基石。

http://www.dtcms.com/a/467380.html

相关文章:

  • RynnVLA-001-7B: 使用人类演示增强机器人Manipulation--达摩院--2025.9.18--开源
  • 网站怎么更新数据云南模板网站建设公司
  • 三维网格(mesh)
  • 做网站需要哪些人才建设网站的心得
  • 银川网站建设是什么19楼网站模板
  • 建设旅游网站的目标大型网站建设基本流程
  • 卷积神经网络CNN(二):对于图像处理的意义
  • 钢材料 网站建设 中企动力网站备案单位查询
  • 高明专业网站建设哪家好永久免费无代码开发平台网站
  • 基于MATLAB/Simulink的飞行器六自由度控制仿真
  • OpenAI 发布Sora2,还发布了 1 个社交应用(附邀请)
  • 百度网站收录入口橙色的网站
  • 【LeetCode热题100(39/100)】对称二叉树
  • 卖产品怎么做网站湖北省市政工程建设官方网站
  • SHAP可视化代码详细讲解
  • 网站建设小wordpress2019谷歌字体
  • 赤峰是住房和城乡建设局网站在哪买网站空间
  • 泉州机票网站建设百度搜索 手机
  • 娄底营销型网站建设网站开发招聘 领英
  • 做配资网站网站建设国内外研究现况
  • 泰州公司网站建设网站怎么做才可以做评价
  • 给人做ppt的网站吗龙岗seo优化
  • 公司域名注册网站哪个好做网站骗老外的钱
  • [特殊字符] Mac 安装 JDK 8 最稳最全教程(Homebrew 方式)
  • 深圳精品网站制作网页小游戏插件不支持
  • 水库信息化网站建设徐州铜山区三盛开发公司
  • 二级网站建设思路深圳app定制开发外包公司
  • python脚本加密之pyarmor
  • 省级荣誉+1!泛联新安入选湖南省2025年先进计算典型应用案例
  • 济南网站怎么做wordpress插件下载失败