当前位置: 首页 > news >正文

常见的深度学习模块/操作中的维度约定(系统性总结)

🟩 1. 数据张量(特征图)维度

这是我们喂进网络或从网络中出来的“实际数据”。

类型维度格式举例说明
图像/特征图(B, C, H, W)(4, 3, 32, 32)PyTorch中最常用的数据布局(NCHW)
图像/特征图(TensorFlow风格)(B, H, W, C)(4, 32, 32, 3)TF/Keras默认的数据格式(NHWC)
序列数据(B, T, D)(4, 100, 512)B=batch, T=时间步数, D=特征维度(比如RNN、Transformer输入)


🟨 2. 卷积层的权重张量维度

这些是参数层的权重,不是输入输出数据!

类型维度格式举例含义
1D 卷积(out_channels, in_channels, kernel_size)(64, 32, 3)只沿时间轴卷积
2D 卷积(out_channels, in_channels, kH, kW)(64, 3, 3, 3)最常见
3D 卷积(out_channels, in_channels, D, H, W)(64, 3, 3, 3, 3)用于体积数据/视频等


🟦 3. 全连接层(Linear)维度

类型权重形状举例含义
FC 层权重(out_features, in_features)(5, 192)5个输出神经元,从192维输入接收信号
输入数据(batch_size, in_features)(4, 192)每个样本是1个向量
输出数据(batch_size, out_features)(4, 5)每个样本输出一个向量


🟧 4. 注意力机制中矩阵维度(尤其是 Transformer)

矩阵维度格式举例说明
Query / Key / Value(B, heads, T, d_k)(4, 8, 100, 64)多头注意力中每一头的特征维度
Attention 权重矩阵(B, heads, T_q, T_k)(4, 8, 100, 100)每个query对所有key的注意力分数
Output(B, T, d_model)(4, 100, 512)每个时间步最终的编码结果


🟥 5. RNN / LSTM / GRU 输入输出维度

类型维度举例说明
输入数据(seq_len, batch, input_size)(100, 4, 128)PyTorch默认格式
输出同输入(100, 4, hidden_size)每一步的输出
hidden / cell(num_layers × num_directions, batch, hidden_size)(2, 4, 128)LSTM/GRU的隐藏状态


🟪 6. BatchNorm 层的参数维度

类型参数形状说明
BatchNorm1d(C,)用于线性层或1D卷积输出的每个通道
BatchNorm2d(C,)对应于每个图像通道
BatchNorm3d(C,)视频/体数据的每个通道
http://www.dtcms.com/a/313459.html

相关文章:

  • io_cancel系统调用及示例
  • e2studio开发RA4M2(6)----GPIO外部中断(IRQ)配置
  • 算法题(181):最大直方矩形面积
  • datasets库 的map方法num_proc=16并行踩坑
  • Java 中的 final 关键字有哪些用法?
  • C++ 虚函数相关问题 **
  • 基于云模型的模糊综合风险评估Matlab代码
  • 网关与路由器的区别
  • access系统调用及示例
  • 延迟任务方案-DelayQueue
  • SpringBoot 2.x 升 3.x 避坑指南:企业级项目的实战问题与解决方案
  • Celery-分布式任务队列
  • MySQL深度理解-MySQL锁机制
  • 数据结构学习(day01)
  • 第八章:进入Redis的SET的核心
  • Android系统模块编译调试与Ninja使用指南
  • 【数据分享】各省粮食外贸依存度、粮食波动率等粮食相关数据合集(2011-2022)(获取方式看文末)
  • 【MATLAB】(六)多项式的创建与四则运算
  • python的高校奖助学金系统
  • 23 Active Directory攻击与防护策略解析
  • 编译旧版本的electron内核
  • SpringBoot之整合MyBatisPlus
  • Nvidia Orin DK 刷机CUDA TensorRT+硬盘扩容+ROS+Realsense+OpenCV+Ollama+Yolo11 一站式解决方案
  • 从“配置地狱”到“云端乐园”——Nacos 如何成为分布式微服务配置中心的“定海神针”
  • 数组和指针的关系
  • 操作系统——读者写者问题
  • KNX协议介绍
  • Nvidia Orin + RealSense D435i 与3D地图实现导航
  • Ubuntu系统VScode实现opencv(c++)视频的处理与保存
  • [硬件电路-129]:模拟电路 - 继电器的工作原理、关键指标、常用芯片与管脚定义