当前位置: 首页 > news >正文

Class21卷积层的多输入通道和多输出通道

Class21卷积层的多输入通道和多输出通道

一.多输入通道
在实际的图像处理或深度学习中,输入不仅仅是二维的,而是通常有多个通道。比如彩色图片是 RGB 的,就有三个通道(R, G, B),输入张量大小是 (C_in, H, W),其中 C_in 是输入通道数。

在这里插入图片描述
每个通道都有一个卷积核,结果是所有通道卷积结果的和

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

二.多输出通道
我们对同一个输入通道,使用不同的卷积核,产生不同的输出通道。

每个卷积核提取的是不同的特征。比如第一个核提边缘,第二个提纹理,第三个提角点

这三个卷积核的结果合在一起,形成一个 shape 为 (3, H_out, W_out) 的输出张量。

在这里插入图片描述

每个输出通道可以识别特定模式,输入通道核识别并组合输入中的模式。

三.1*1卷积层

1×1 卷积并不是“看 1 个像素”,虽然它在空间上(宽度 × 高度)只看一个位置,但它会同时操作所有输入通道。所以它并不是空间卷积,而更像是通道维度上的线性变换(或降维/升维)。

假设有输入X
输入张量可以想象为两张叠在一起的图:
在这里插入图片描述
现在加入一个 1×1 卷积层,输出通道设为1。
其中卷积核的作用为:它只看当前像素的两个通道的值,然后“加权融合”。

卷积核权重:

通道1权重:0.1
通道2权重:0.5

在这里插入图片描述
最后输出为:
在这里插入图片描述

1×1 卷积就是在“每个像素”位置上,把多个通道的值做一个加权混合,变成新的通道表示。它像是一个轻量版的全连接层,每个位置共享参数,对通道信息进行重组或压缩。

在这里插入图片描述

http://www.dtcms.com/a/297954.html

相关文章:

  • 基于纳米流体强化的切割液性能提升与晶圆 TTV 均匀性控制
  • 轻量级音乐元数据编辑器Metadata Remote
  • [NPUCTF2020]ReadlezPHP
  • iOS —— 天气预报仿写总结
  • SQL164 2021年11月每天新用户的次日留存率
  • ReAct Agent(LangGraph实现)
  • 去除视频字幕 2, 使用 PaddleOCR 选取图片中的字幕区域, 根据像素大小 + 形状轮廓
  • MCP 与传统集成方案深度对决:REST API、GraphQL、gRPC 全方位技术解析
  • react 内置hooks 详细使用场景,使用案例
  • 轮盘赌算法
  • Python爬虫实战:研究Talon相关技术构建电商爬虫系统
  • ZLMediaKit 源代码入门
  • Java排序算法之<选择排序>
  • IT领域需要“落霞归雁”思维框架的好处
  • 熵与交叉熵:从信息论到机器学习的「不确定性」密码
  • Jmeter的元件使用介绍:(四)前置处理器详解
  • 告别静态文档!Oracle交互式技术架构图让数据库学习“活“起来
  • 多步相移小记
  • epoll_event数据结构及使用案例详解
  • springboot(3.4.8)整合mybatis
  • 分布式方案 一 分布式锁的四大实现方式
  • android app适配Android 15可以在Android studio自带的模拟器上进行吗,还是说必须在真机上进行
  • HashMap底层实现原理与核心设计解析
  • AI同传领域,字节跳动与科大讯飞激战进行时
  • 【Linux系统】基础IO(下)
  • 深度学习篇---图像数据采集
  • classgraph:Java轻量级类和包扫描器
  • 深度学习篇---深度学习中的卡尔曼滤波
  • Vmware VSAN主机停机维护流程
  • RAG、Function Call、MCP技术笔记