当前位置: 首页 > wzjs >正文

笔记本怎么建设网站制作一个app

笔记本怎么建设网站,制作一个app,wordpress 装修公司主题,装潢设计图片大全如是我闻: 以下是多头注意力(Multi-Headed Attention)在计算时常见的张量维度变换总结,帮助理解从输入到输出是如何一步步处理的。为了方便,令: B B B 表示 batch size(批量大小) S …

如是我闻: 以下是多头注意力(Multi-Headed Attention)在计算时常见的张量维度变换总结,帮助理解从输入到输出是如何一步步处理的。为了方便,令:

  • B B B 表示 batch size(批量大小)
  • S S S 表示 sequence length(序列长度)
  • m m m 表示 num_heads(注意力头数)
  • h h h 表示 head_size(每个头的维度)
  • d m o d e l = m × h d_{\mathrm{model}} = m \times h dmodel=m×h 表示模型隐层维度

  1. 输入(queries、keys、values)
    形状 = ( B , S , d m o d e l ) . \text{形状} = (B,\, S,\, d_{\mathrm{model}}). 形状=(B,S,dmodel).
    在「自注意力」(self-attention)场景下,三者通常是同一个张量;在「交叉注意力」(cross-attention)场景下, queries \texttt{queries} queries keys, values \texttt{keys, values} keys, values 可能来自不同子网络。

  2. 线性映射( W Q , W K , W V W_Q, W_K, W_V WQ,WK,WV

    • queries \texttt{queries} queries 做线性变换得到 (Q):形状仍为 ( B , S , d m o d e l ) (B, S, d_{\mathrm{model}}) (B,S,dmodel)
    • keys \texttt{keys} keys 做线性变换得到 K K K:形状同上
    • values \texttt{values} values 做线性变换得到 V V V:形状同上
  3. 拆分 heads(split heads)

    • ( B , S , d m o d e l ) (B, S, d_{\mathrm{model}}) (B,S,dmodel) reshape + transpose 成 ( B , m , S , h ) (B, m, S, h) (B,m,S,h)
    • 这样每个 batch、每个序列位置上就可以拆出 m m m 个“头”,每个头维度为 h h h
    • 拆分后:
      Q , K , V → split ( B , m , S , h ) . Q, K, V ~\xrightarrow{\text{split}}~ (B,\, m,\, S,\, h). Q,K,V split  (B,m,S,h).
  4. 计算注意力分数(scores)

    • 使用 scaled dot-product:
      scores = Q × K T h 形状 = ( B , m , S , S ) . \text{scores} = \frac{Q \times K^T}{\sqrt{h}} \quad\text{形状} = (B,\, m,\, S,\, S). scores=h Q×KT形状=(B,m,S,S).
    • 此时会应用「下三角 mask」(causal mask)以保证自回归:只关注「过去和当前」位置,屏蔽「未来」位置。
    • scores \text{scores} scores s o f t m a x \mathrm{softmax} softmax 得到注意力权重 a t t n _ w e i g h t s \mathrm{attn\_weights} attn_weights
  5. 加权求和(attended values)
    attended_values = a t t n _ w e i g h t s × V , 形状 = ( B , m , S , h ) . \text{attended\_values} = \mathrm{attn\_weights} \times V, \quad \text{形状} = (B,\, m,\, S,\, h). attended_values=attn_weights×V,形状=(B,m,S,h).
    这样就得到每个 head 对原值向量的加权结果。

  6. 合并 heads(merge heads)

    • ( B , m , S , h ) (B, m, S, h) (B,m,S,h) 还原到 ( B , S , m × h ) (B, S, m \times h) (B,S,m×h),即 ( B , S , d m o d e l ) (B, S, d_{\mathrm{model}}) (B,S,dmodel)
    • 合并之后,相当于将所有 head 的信息拼接到最后一个维度上。
  7. 可选的最终线性映射 W O \mathbf{W}_O WO

    • 多数实现会继续用一个线性层 W O \mathbf{W}_O WO(同样是 ( d m o d e l , d m o d e l ) (d_{\mathrm{model}}, d_{\mathrm{model}}) (dmodel,dmodel))把拼接后的多头输出再次投影,形状保持 ( B , S , d m o d e l ) (B, S, d_{\mathrm{model}}) (B,S,dmodel)

通过以上步骤,多头注意力便可将序列的上下文信息捕获到不同的 head(不同的子空间),再合并形成新的隐层表示。

cao!


文章转载自:

http://C3bXIZ7m.pqcsx.cn
http://cScEsgWV.pqcsx.cn
http://rREuy35F.pqcsx.cn
http://h3EpvRjg.pqcsx.cn
http://cryu5Etj.pqcsx.cn
http://PzC7XOiZ.pqcsx.cn
http://kGdZZ7Oc.pqcsx.cn
http://155lUxRN.pqcsx.cn
http://sRwn6yrS.pqcsx.cn
http://wH14yD1w.pqcsx.cn
http://wpqgaIJC.pqcsx.cn
http://xgktJxyo.pqcsx.cn
http://9pFRdFFo.pqcsx.cn
http://9RMYQ188.pqcsx.cn
http://PPuUU9fr.pqcsx.cn
http://NZrQe9eI.pqcsx.cn
http://TJ5xXbE9.pqcsx.cn
http://ZyM4uOCQ.pqcsx.cn
http://lRC8sx4w.pqcsx.cn
http://PPCJcauF.pqcsx.cn
http://vKsxk2dm.pqcsx.cn
http://il8SAjTL.pqcsx.cn
http://PuN2bQcW.pqcsx.cn
http://abNL2JtM.pqcsx.cn
http://aEx9zVJS.pqcsx.cn
http://mynT6xmG.pqcsx.cn
http://iemw3VNE.pqcsx.cn
http://NaBMwhzm.pqcsx.cn
http://PMBzoh5Q.pqcsx.cn
http://HarixJiA.pqcsx.cn
http://www.dtcms.com/wzjs/669521.html

相关文章:

  • 珠海建设改革有哪些网站网页模板下载html
  • 前端做的网站手机搜索和网站搜索的排名
  • 大气网站首页如何自己做网站手机
  • 河南睢县筑宇建设网站深圳网站设计 制作
  • 做网站确定什么主题好seo排名的公司
  • 个人网站备案电话访谈python编程语言大全
  • 手机上怎么支持wap网站公众号开发网站
  • 保定建设环境项目网站示范校建设平台网站典型案例
  • 淘客cms建站系统天猫店铺一个多少钱
  • 网站编辑没有经验可以做吗做医疗网站颜色选择
  • 品牌网站建设搭建国内做网站大公司有哪些
  • 北京网站建设套餐安徽省公路建设行业协会网站
  • 优度网站建设wordpress个人博客简约
  • 三亚哪里做网站电气网站模板
  • 建设银行的官方网站积分商场平面设计在哪里接单
  • 网站的字体做多大合适广州做网站优化哪家专业
  • 企业网站服务器租用网站布局设计教程
  • 网站备案后台深圳抖音seo
  • 怎么创作自己的网站网站ie浏览器不兼容
  • 为什么网站显示正在建设游戏客户端开发
  • 寿光建设集团网站网页设计心得5000字
  • 公司英文网站建设wordpress 禁止转码
  • 做网站分销违法吗网站建设目录
  • 红河优才网站建设里水网站建设
  • 服务器里怎么建设网站那个网站可以做空比特币
  • 产品网站别人是如何做优化的哪个网站做h5号
  • 建立网站要钱吗?wordpress主题know
  • 柳江网站建设深圳市做网站建设
  • 怎么自己做微网站wordpress建站收录快
  • 自己做网站开店中山外贸营销网站建设