当前位置: 首页 > news >正文

图像张量中的通道维度

通道维度”是图像张量中的一个非常重要的维度,它表示图像中有多少种颜色(或特征图),我们来详细解释一下:


✅ 什么是通道维度(channel dimension)?

在深度学习中,图像通常用一个 4维的张量(tensor) 来表示,维度结构如下:

[批量大小, 通道数, 高度, 宽度]batch_size, channels, height, width

举例:灰度图像 vs 彩色图像
  • 灰度图像(黑白图)

    • 通道数 = 1 → [batch_size, 1, height, width]

    • 每个像素只有一个数值,表示灰度(亮度)

  • RGB彩色图像

    • 通道数 = 3 → [batch_size, 3, height, width]

    • 每个像素由 R、G、B 三个值组成


✅ 若张量 X 的形状为

X.shape = [18, 1, 28, 28]

意思是:

  • 有 18 张图像(batch size = 18)

  • 每张图像是 28×28 的 灰度图像

  • 每张图像有 1 个通道(channel)


X.reshape(18, 28, 28) 是干什么的?

它把原本形状为 [18, 1, 28, 28] 的张量 去掉了通道维度 1,变成:

[18, 28, 28]

这是因为:

  • imshow 这个函数用于显示图像时,灰度图只需要 [height, width]

  • PyTorch 加载数据时默认保留通道维度 [1, 28, 28]

  • 为了显示,我们需要手动“压缩”掉通道维度:reshape(18, 28, 28)squeeze(1)


✅ 通道维度的作用(在 CNN 中)

在卷积神经网络中,通道维度非常重要:

  • 输入图像的通道数决定了第一层卷积核的大小

  • 中间每一层卷积通常会增加通道数,表示提取了更多特征

例如:

输入:[1, 28, 28]
第一层卷积后:[16, 28, 28](提取16个特征图)

✅ 总结一句话:

“通道维度”表示图像中颜色或特征的种类。灰度图是1个通道,RGB是3个通道。在可视化灰度图像时,我们通常会把形状 [1, 28, 28] 变成 [28, 28],以便 matplotlib 正确显示。

http://www.dtcms.com/a/313676.html

相关文章:

  • 力扣经典算法篇-41-旋转图像(辅助数组法,原地旋转法)
  • Kubernetes中ingess以及它和nginx的关系
  • 单表查询-模糊匹配
  • CMake 命令行参数完全指南(4)
  • sqli-labs靶场less26/a
  • awk对文本进行列处理
  • 【实习总结】Qt通过Qt Linguist(语言家)实现多语言支持
  • 抖音全新推荐大模型RankMixer
  • 【AI论文】ScreenCoder:通过模块化多模态智能体推动前端自动化中的视觉到代码生成技术发展
  • 从零开始实现Qwen3(Dense架构)
  • Linux 环境下 Docker 安装与简单使用指南
  • 7.28-8.3周报
  • 控制建模matlab练习10:滞后补偿器
  • OSPF笔记及综合实验报告册
  • 嵌入式 Linux 系统构建的核心组件详解
  • Go 工程化全景:从目录结构到生命周期的完整服务框架
  • 【openlayers框架学习】六:绘制点、圆、文字标注
  • 关于vllm【常见问题解决方案】
  • XtraBackup备份与恢复
  • Python 程序设计讲义(61):Python 的函数——变量的作用域
  • 【运维基础】Linux 硬盘分区管理
  • [Oracle] DUAL数据表
  • [自动化Adapt] 录制引擎 | iframe 穿透 | NTP | AIOSQLite | 数据分片
  • 第二节 YOLOv5参数
  • Python 程序设计讲义(59):Python 的函数——labmda函数(匿名函数)
  • 四、驱动篇-HDF驱动介绍2
  • sublime 乱码问题
  • JavaEE文件泄露与修复方案
  • Linux | i.MX6ULL移植 Gdb+Gdbserver 调试(第十四章)
  • 深入解析 Linux Kernel 中的设备树:使用、修改与实际应用