当前位置: 首页 > wzjs >正文

做征婚网站有哪些win7优化大师官方免费下载

做征婚网站有哪些,win7优化大师官方免费下载,设计友好的网站,做装修效果图的网站有哪些前置知识 设矩阵 A 的维度为 mn,矩阵 B 的维度为 np,则它们相乘后得到矩阵 C 的维度为 mp。其中,C 中每个元素的计算需要进行 n 次乘法和 n−1 次加法。也就是说,总的浮点运算次数(FLOPs)约为 m p (2n) …

前置知识

设矩阵 A 的维度为 m×n,矩阵 B 的维度为 n×p,则它们相乘后得到矩阵 C 的维度为 m×p。其中,C 中每个元素的计算需要进行 n 次乘法和 n−1 次加法。也就是说,总的浮点运算次数(FLOPs)约为 m × p × (2n) ≈ 2 × m × n × p。

Attention核心部分的计算

在一个 attention head 中,假设输入序列长度为 t,每个位置的表示维度(即 embedding 维度)为 d_head。在计算 self-attention 时,主要包含两个矩阵乘法操作:

1.查询矩阵与键矩阵的转置相乘(Q × K^T),计算量为 2 × t × t × d_head;
2.得分矩阵与值矩阵相乘,计算量同样为 2 × t × t × d_head。

则核心部分的总FLOPs为 4 × t × t × d_head

由于 Transformer 中通常使用多头注意力机制,设共有 n_head 个 head,并且每个 head 的维度为 d_head,那么有 d_model = n_head × d_head。于是所有 head 总共的 FLOPs 为:

4 × t × t × d_head × n_head = 4 × t × t × d_model

可见,在只考虑 attention 核心部分时,FLOPs 与 head 数量无关,仅与序列长度呈平方关系。

含有模型参数的矩阵乘法部分的FLOPs计算

除了注意力分数的计算外,Transformer 中还涉及多个由模型权重参与的线性映射,这些运算的 FLOPs 与序列长度呈线性关系。主要包括以下几个部分:
1.Q,K,V的映射:每个为输入矩阵(t × d_model)与权重矩阵(d_model × d_model)相乘,计算量为 2 × t × d_model × d_model(乘法与加法合计);三者合计为:
FLOPs ≈ 3 × 2 × t × d_model × d_model = 6 × t × d_model × d_model

2.concat以后的映射:拼接后的张量维度仍为 t × d_model,再乘以一个 d_model × d_model 的权重矩阵,FLOPs 为:
FLOPs ≈ 2 × t × d_model × d_model

综上,所有包含模型参数的线性变换的总 FLOPs 为:
FLOPs ≈ 8 × t × d_model × d_model

这部分 FLOPs 与序列长度 t 成线性关系。

总结

FLOPs的计算量可归结为2部分,其中一部分FLOPs与序列长度t呈平方关系,另一部分与序列长度 t 成线性关系,而且前者与n_head无关

http://www.dtcms.com/wzjs/169114.html

相关文章:

  • 大型网站开发 书籍企业培训网
  • 嘉兴网站专业制作网络营销与策划试题及答案
  • 做网站用什么开发好推广信息发布平台
  • 长春模板网站建站五种营销工具
  • 福步外贸人才网seo还可以做哪些推广
  • 企业电子网站的建设案例百度网页搜索
  • 新闻网站设计原则营销策略ppt模板
  • 有没有可靠的网站建设最近刚发生的新闻
  • 武汉建设网站官网百度做网站
  • 360网站卖东西怎么做的最近比较火的关键词
  • 网页显示网站正在建设中怎么做电子技术培训机构
  • 郑州高端网站建设网站制作详细流程
  • 大连公司网站建设外贸seo建站
  • 外贸网站建设商家苏州网站seo优化
  • 云南旅行社网站建设关键词搜索排名推广
  • 湖南岳阳网站建设公司黄页顺企网克州seo整站排名
  • 外贸网站建设公司流程百度搜索网页版入口
  • 做网站用手机网页制作软件
  • wordpres做视频网站网站推广的途径和方法
  • 音视频网站建设可行性报告石家庄网络营销
  • 大学生建设什么网站好东莞做网站的公司吗
  • 深圳高端网站建设费用代发推广百度首页包收录
  • 建什么网站赚钱成都网站建设方案托管
  • 做企业网站软件如何自己创建一个网站
  • 大理网站建设网络营销方法
  • 任县网站制作seo推广官网
  • 网站名称查询品牌推广的概念
  • wordpress 文章幻灯片河源网站seo
  • 沈阳网站定制蜘蛛搜索引擎
  • 做网站如何防止被黑软文推广发布