当前位置: 首页 > news >正文

MMAction2重要的几个配置参数

embed_dims(全称 embedding dimensions)是指每个 patch(块)或特征的通道数/维度,是 Transformer 或 Swin Transformer 等模型中最核心的特征表示维度。
embed_dims 必须能被 num_heads 整除
具体解释

  • 在 Swin Transformer、ViT 等模型中,输入视频/图片会被切分成小块(patch),每个 patch 会被投影(线性变换)到一个高维空间,这个空间的维度就是 embed_dims。
  • 后续所有的注意力、MLP 等操作,都是基于这个维度进行的。

举例

  • 如果 embed_dims=96,每个 patch 会被编码成 96 维的特征向量。
  • 如果 embed_dims=32,每个 patch 会被编码成 32 维的特征向量。

影响

  • embed_dims 越大,模型表达能力越强,但参数量和计算量也越大。
  • embed_dims 越小,模型更轻量,但表达能力会下降。

相关文章:

  • 【C++】内存管理,深入解析new、delete
  • 预算超支、进度延误?工程企业如何实现精准管理?
  • 计算机系统简介(二)
  • 数据结构基础知识补充
  • BGP配置命令详细框架
  • 清除谷歌浏览器中的“您的浏览器由所属组织/贵单位管理”
  • Vuex Actions: 异步操作
  • C 语言学习笔记(指针6)
  • vue + ant-design + xlsx 实现表格数据导出
  • jsAPI:Intl.DateTimeFormat 属性含义
  • 原子操作(Atomic Operations)在SOC中的应用场景
  • LINUX安装运行jeelowcode前端项目
  • c++进阶——智能指针
  • 中建海龙携MiC技术亮相双博会 引领模块化建筑新潮流
  • 【监控】Blackbox Exporter 黑盒监控
  • 第12次08: 省市县区三级联动收货地址
  • 华为OD机试真题——区间交集(2025B卷:200分)Java/python/JavaScript/C/C++/GO最佳实现
  • 两个Ubuntu机器(内网)免密登录设置
  • 嵌入式学习Day28
  • 移动端H5拍照直传不落地方案
  • 做高效能的父母网站/手机游戏性能优化软件
  • 办公室设计装修咨询/广西seo经理
  • 做网站服务器一年多少钱/合肥网站
  • 北京电力建设公司现状/北京网站优化步
  • 教做幼儿菜谱菜的网站/大数据培训班需要多少钱
  • wordpress首页访问密码/专业seo站长工具