当前位置: 首页 > wzjs >正文

汕头企业网站模板建站深圳城乡和建设局网站

汕头企业网站模板建站,深圳城乡和建设局网站,网站建设的工作描述,网站建设产品服务为什么将嵌入维度移动到中间位置 将输入张量从 [B, L, D] 转置为 [B, D, L] 的主要原因是为了符合 PyTorch 中卷积层的输入格式要求: PyTorch 卷积层的输入格式 在 TokenEmbedding 类中,使用了 nn.Conv1d 进行卷积操作。对于 PyTorch 中的一维卷积层&…

为什么将嵌入维度移动到中间位置

将输入张量从 [B, L, D] 转置为 [B, D, L] 的主要原因是为了符合 PyTorch 中卷积层的输入格式要求:

PyTorch 卷积层的输入格式

TokenEmbedding 类中,使用了 nn.Conv1d 进行卷积操作。对于 PyTorch 中的一维卷积层:

  • 要求输入格式[批次大小, 输入通道数, 序列长度][B, C, L]
  • 实际输入格式:原始时间序列为 [B, L, D],其中 D 是特征维度

维度重排的目的

  1. 符合卷积要求

    • 将特征维度 D 移到第二个位置,作为卷积的输入通道
    • 将序列长度 L 移到第三个位置,作为卷积操作的滑动维度
  2. 卷积操作方向

    • 这样转置后,卷积核就会沿着时间维度(序列长度)滑动
    • 对每个特征通道同时应用相同的卷积操作
  3. 恢复原始排列

    • 卷积后得到 [B, d_model, L]
    • 再通过 transpose(1, 2) 转回 [B, L, d_model],以符合 Transformer 结构的输入要求

这种设计使模型能够有效捕获时间序列中的局部模式,同时保持与后续 Transformer 层的兼容性。

一维卷积(1D Conv)在TokenEmbedding中的输出计算过程

在TokenEmbedding类中,使用了一维卷积将输入特征从c_in维映射到d_model维。下面详细解释其计算过程:

卷积参数

self.tokenConv = nn.Conv1d(in_channels=c_in, out_channels=d_model,kernel_size=3, padding=padding, padding_mode='circular', bias=False)
# 例如: Conv1d(7, 512, kernel_size=(3,), stride=(1,), padding=(1,), bias=False, padding_mode=circular)

输出尺寸计算公式

一维卷积的输出长度计算公式:

L_out = (L_in + 2*padding - dilation*(kernel_size-1) - 1) / stride + 1

计算过程

假设输入x形状为[B, L, D],其中D等于c_in

  1. 维度重排

    x.permute(0, 2, 1)  # 从[B, L, D]变为[B, D, L]
    
  2. 卷积操作

    • 输入:[B, c_in, L]
    • 权重矩阵:[d_model, c_in, kernel_size]
    • 卷积核在序列上滑动,每个位置产生d_model个输出特征
    • 针对每个输出通道j:
      output[b,j,i] = Σ(input[b,c,i+k] * weight[j,c,k])
      
      其中b是批次索引,c遍历所有输入通道,k遍历卷积核位置
  3. 输出形状

    • 使用适当的padding(1或2)保持序列长度L不变
    • 卷积后形状:[B, d_model, L]
  4. 最终转置

    .transpose(1, 2)  # 从[B, d_model, L]变为[B, L, d_model]
    

实际意义

这个卷积操作的实际意义是:

  • 捕获输入时间序列中的局部模式
  • 将原始特征维度映射到模型的嵌入维度
  • 通过循环填充(circular padding)处理时间序列的边界,认为时间序列是周期性的
  • 为每个时间步生成一个维度为d_model的特征表示

通过这种方式,输入序列的每个时间步都被转换成一个更丰富的表示,作为Transformer模型的输入。## 实际意义

这个卷积操作的实际意义是:

  • 捕获输入时间序列中的局部模式
  • 将原始特征维度映射到模型的嵌入维度
  • 通过循环填充(circular padding)处理时间序列的边界,认为时间序列是周期性的
  • 为每个时间步生成一个维度为d_model的特征表示

通过这种方式,输入序列的每个时间步都被转换成一个更丰富的表示,作为Transformer模型的输入。

http://www.dtcms.com/wzjs/661101.html

相关文章:

  • wordpress产品系统优化seo可以从以下几个方面进行
  • 网站开发的三个流程深圳网站设计x程序
  • 多功能网站建设服务至上办公邮箱最常用的是什么邮箱
  • 建设部网站官网四库一平台自己做的网站可以买东西吗
  • 深圳网站建设服务有限公司苏州建设网站公司
  • 网站制作软件品牌商城网站建设公司
  • 游戏门户网站 织梦学网站建设需要几年
  • 浦项建设中国有限公司网站优就业seo
  • 营销型网站的付费推广渠道搭建网站建设
  • 嘉兴外贸网站建昆山建设局网站查预售
  • 成都新线加做网站建筑模板规格尺寸及价格
  • 织梦网站程序wordpress交流
  • 官方购物网站正品国家建筑工程信息平台
  • 关于电商网站规划方案关于网站建设方案的案例
  • 免费单页网站在线制作自己在家做电商
  • 婚纱网站建设 最开始俄罗斯跨境电商平台ozon
  • 佛山建设公司网站网站布局设计分析特点
  • 设计网站界面工程项目信息网
  • 怎么样查看网站开发语言端点seo博客
  • 北京国贸网站建设公司动画制作软件an
  • 已有域名怎么做网站洛阳网络公司排名
  • 网站推广的途径和要点个人网站制作与设计论文
  • 移动网站技术建设工程公司组织架构图
  • 自助网站开发海外营销公司
  • 网站前台怎么做凡客官网旗舰店
  • 个人博客网站制作流程文件夹里内容做网站的分类
  • 驻马店北京网站建设wordpress 无广告视频
  • 怎样在建设部网站上查公司信息佛山网站建设哪个
  • 网站建设编码公司网站图片传不上去
  • 北京海淀工商局网站阳江人才招聘网官网