当前位置: 首页 > news >正文

卷积理解-excel数据图表演示

计算机视觉任务中,第一层卷积层可以学习到简单的边缘特征,而第二层卷积层可以学习到更加复杂的形状和纹理特征。因此,通过多层卷积层堆叠,可以逐渐学习到更加抽象和高级的特征表示

1. 一维卷积 Conv1D

我们考虑一个简单的情况,就像处理时间序列数据一样。想象你正在观察某个城市在一周内的每日气温变化。你想要通过一维卷积来平滑这些数据,以便更好地理解气温趋势(在该例子其实就是三个连续数值不同加权求和得到一个代表性的数值)。
在这里插入图片描述
在这里插入图片描述
我们看到,一个卷积数据:
39.6 = 20 * 0.5 + 22 * 0.8 + 24 * 0.5
42.7 = 22 * 0.5 + 24 * 0.8 + 25 * 0.5
卷积的值实际是原始3个数据的加权求和。
我们使用一维卷积核来平滑气温数据,从而减少数据中的噪声,更好地观察气温的整体变化趋势。
在这里插入图片描述

2. 二维卷积Conv2D

一维卷积和二维卷积的区别在于卷积操作的维度不同。在一维卷积中,卷积核只会在一个方向上进行滑动操作,例如在处理时间序列数据时,卷积核只会在时间轴上进行滑动操作。而在二维卷积中,卷积核会在两个方向上进行滑动操作,例如在处理图像数据时,卷积核会在图像的高度和宽度上进行滑动操作。因此,一维卷积和二维卷积的计算方式略有不同,但本质上都是将卷积核与输入数据进行点积运算,得到特征图作为下一层的输入。

应用

卷积层是卷积神经网络的核心基石。在图像识别里我们提到的卷积是二维卷积,即卷积核与二维图像做卷积操作,简单讲是卷积核滑动到二维图像上所有位置,并在每个位置上与该像素点及其领域像素点做内积,就如上图所示。不同卷积核可以提取不同的特征 ,在深层卷积神经网络中,通过卷积操作可以提取出图像低级到复杂的特征。

3. 三维卷积Conv3D

在三维卷积中有两种例子,其中之一假设你有一张**彩色图像,其中包含红、绿、蓝三个颜色通道。这样的彩色图像可以表示为一个三维数组,其中每个元素包含了图像在特定位置的颜色信息。**假设你想要对图像应用一个卷积核来进行边缘检测。边缘检测可以帮助我们找到图像中的边界或轮廓。这时,我们需要使用一个三维卷积核来处理彩色图像的每个颜色通道。考虑一个简单的三维卷积核,形状为 3x3x3,表示在3个颜色通道上的3x3的局部感知区域。卷积核会在图像的每个位置滑动,并执行元素乘法和相加操作,以获取特定位置的输出值。例如,对于图像中的某个位置,卷积操作会在每个颜色通道上执行元素乘法和相加,得到一个输出值。这个操作会在图像的所有位置重复进行,从而生成一个新的三维输出图像。这个例子中的三维卷积核用于边缘检测时,会对图像的每个颜色通道执行类似于边缘检测的操作。它可以帮助我们在每个颜色通道上找到图像中的边缘或轮廓。还有一个例子是视频行为识别。假设你正在监控一间会议室,里面有多个人在进行不同的活动,例如站立、走动、举手等。你想要使用卷积神经网络来识别不同的行为。在这个场景中,视频可以看作是一个三维数据,它由两个空间维度(图像的宽度和高度)和一个时间维度(视频的帧数)组成。这样的视频可以表示为一个三维数组,其中每个元素代表一个像素值或颜色信息。为了对视频进行行为识别,我们需要使用三维卷积核来处理视频数据。这个卷积核在空间维度上滑动,同时在时间维度上遍历视频的帧,执行元素乘法和相加操作,以获取特定位置和时间的输出值。例如,考虑一个形状为 3x3x3x3 的三维卷积核,其中前两个维度表示在一个3x3的局部感知区域内,每个颜色通道的像素值,最后一个维度表示卷积核在时间维度上遍历视频的3帧。在应用三维卷积时,卷积核会在视频的每个位置和每个时间点滑动,并对每个颜色通道执行元素乘法和相加操作,得到一个输出值。这样的操作会在整个视频上重复进行,生成一个新的三维输出,表示不同时间点和空间位置的特征。这个例子中的三维卷积核用于视频行为识别时,可以帮助我们捕捉不同行为在时间序列上的特征变化。例如,当某人举手时,可能在一段时间内会出现特定的手臂移动模式(一种数据变化模式),而这个三维卷积可以帮助我们捕捉这种时间序列上的模式。三维卷积层用于医学领域、视频处理领域(检测人物行为),用于三个维度的卷积。
在这里插入图片描述
三维卷积对数据集应用三维过滤器,过滤器向3个方向(x,y,z)移动,计算低层特征表示。输出形状是一个三维体积空间,如立方体或长方体。有助于视频、三维医学图像等的目标物检测。三维卷积的输入形状为五维张量(batch_size, frames, height, width, channels),batch_size为批处理数据的大小,frams可以理解为视频中的帧数,其中每一帧为一幅图像,height为图像的高度,width为图像的宽度,channels为图像通道数。输出形状也是一个五维张量。

4. 反卷积

假设你有一张古老的照片,由于年代久远和物理损坏,照片上出现了许多破损、划痕和噪点。你希望使用反卷积来修复照片,恢复其原始的清晰度和细节。在这个场景中,反卷积可以用于学习照片修复过程,将破损和损坏的像素映射到原始清晰的像素。这样的修复过程可以通过训练反卷积网络来实现。反卷积网络使用反卷积层来进行图像修复。输入是破损的图像,输出是修复后的图像。例如,考虑一个简单的反卷积层,输入是一张破损的图像(例如,256x256像素),输出是一张修复后的图像(例如,256x256像素)。在反卷积过程中,网络会使用反卷积核来将破损和损坏的像素恢复到原始图像的空间维度上。通过训练网络学习图像的修复过程,它可以从破损的输入图像中恢复出丢失的细节和结构,使修复后的图像更加清晰和自然。实际应用中,反卷积在图像修复和复原中起着重要作用。它可以帮助修复老旧照片、受损图像或受到噪声污染的图像,恢复它们的原始外观和细节。这个生活例子展示了反卷积在图像修复中的应用,通过学习将破损的像素映射到原始清晰的像素,实现图像的修复和恢复。反卷积(deconvolution)也称为转置卷积(transpose convolution),是一种常用于图像处理和计算机视觉领域的操作。它可以将一个低维度的特征映射(如经过卷积和池化后的结果)还原成更高维度的特征映射,通常用于图像分割、目标检测等任务中。它是一种特殊的卷积,先padding来扩大图像尺寸,紧接着跟正向卷积一样,旋转卷积核180度,再进行卷积计算。看上去就像,已知正向卷积的输出图像,卷积核,得到正向卷积中的原始图像(并非真的得到原始图像,像素点是不一样的,但是尺寸是一致的)。它看上去像是正向卷积的逆运算,但其实并不是。因为反卷积只能还原原始图像的尺寸,但是并不能真的恢复原始图像内容,即每个元素值其实是不一样的。由于卷积核一般比原始图像小,所以卷积之后的图像尺寸往往会变小。有时候我们需要将卷积后的图像还原成原始图像的尺寸,即实现图像从小分辨率到大分辨率的映射,这种操作就叫做上采样(Upsampling)。而反卷积正是一种上采样方法。

http://www.dtcms.com/a/356584.html

相关文章:

  • 开源大语言模型(Qwen3)
  • 基于Velero + 阿里云 OSS的Kubernetes 集群的备份与恢复
  • Kubernetes 与 GitOps 的深度融合实践指南
  • 国产数据库转型指南:DBA技能重构与职业发展
  • 面试问题详解十一:Qt中的线程池与 QRunnable
  • 阿里云百炼智能体连接云数据库实践(DMS MCP)
  • Qt事件_xiaozuo
  • Baseline|基线
  • Linux: proc: pid: coredump_filter
  • Redis搭建哨兵模式一主两从三哨兵
  • GO入门(一)——安装和了解
  • MySQL底层数据结构与算法浅析
  • “设计深圳”亚洲权威消费科技与室内设计盛会
  • CVPR 强化学习模块深度分析:连多项式不等式+自驾规划
  • 在Linux的环境下安装GitLab(保姆级别)
  • 打造高效外贸网站:美国服务器的战略价值
  • 阻塞,非阻塞,同步,异步的理解
  • Windows 下 MSYS2 + MinGW-w64 配置 Fyne GUI 编译环境全流程
  • 【计算机408计算机网络】第三章:自底向上五层模型之数据链路层
  • WINTRUST!_GetMessage函数分析之CRYPT32!CryptSIPGetSignedDataMsg函数的作用是得到nt5inf.cat的信息
  • 【算法】链表专题
  • 钉钉补卡事件处理方案
  • uni-app 跨平台项目的 iOS 上架流程:多工具组合的高效协作方案
  • 常见视频封装格式对比
  • 从零开始学习单片机16
  • 数据结构——线性表(链表,力扣中等篇,增删查改)
  • AI接管浏览器:Anthropic发布Claude for Chrome,是效率革命还是安全噩梦?
  • MySQL-内置函数
  • Python 【深度解析】线程与进程:操作系统中多任务的核心机制
  • WebRTC音频QoS方法五(音频变速算法之Expand算法实现)