当前位置: 首页 > wzjs >正文

优化网站架构海淀视频网站建设

优化网站架构,海淀视频网站建设,烟台福山网站建设,陵水专业网站建设XAttention 计算步骤详解及示例 XAttention 是一种高效的块稀疏注意力机制,通过 反对角线评分(Antidiagonal Scoring) 和 动态阈值选择 来优化长序列 Transformer 模型的推理效率。以下是其核心计算步骤及具体示例。 1. XAttention 的核心步…

XAttention 计算步骤详解及示例

XAttention 是一种高效的块稀疏注意力机制,通过 反对角线评分(Antidiagonal Scoring)动态阈值选择 来优化长序列 Transformer 模型的推理效率。以下是其核心计算步骤及具体示例。


1. XAttention 的核心步骤

Step 1: 计算原始注意力分数

输入:

  • Query Q ∈ R n × d Q \in \mathbb{R}^{n \times d} QRn×d
  • Key K ∈ R m × d K \in \mathbb{R}^{m \times d} KRm×d
  • Value V ∈ R m × d v V \in \mathbb{R}^{m \times d_v} VRm×dv

计算未缩放的注意力分数:
S = Q K T S = QK^T S=QKT

Step 2: 反对角线评分(Antidiagonal Scoring)

  1. 分块计算:将 S S S 划分为 B × B B \times B B×B 的块(如 8 × 8 8 \times 8 8×8)。
  2. 反对角线求和:对每个块,计算反对角线(从左下到右上)元素的和,作为块的重要性分数:
    Score = ∑ i + j = k A i , j \text{Score} = \sum_{i+j=k} A_{i,j} Score=i+j=kAi,j
    • 其中 k k k 是反对角线索引,例如 k = 0 , 1 , . . . , 2 B − 2 k=0,1,...,2B-2 k=0,1,...,2B2

Step 3: 阈值块选择

  1. 归一化:对块分数进行 softmax 归一化:
    P = softmax ( Score ) P = \text{softmax}(\text{Score}) P=softmax(Score)
  2. 选择关键块:保留累积概率超过阈值 τ \tau τ 的最小块集合 B ∗ B^* B
    B ∗ = arg ⁡ min ⁡ ∣ B ∣ s.t. ∑ ( i , j ) ∈ B P i , j > τ B^* = \arg \min |B| \quad \text{s.t.} \quad \sum_{(i,j) \in B} P_{i,j} > \tau B=argminBs.t.(i,j)BPi,j>τ

Step 4: 稀疏注意力计算

仅计算选中的关键块 B ∗ B^* B 的注意力权重,并加权聚合 V V V
Output = ∑ ( i , j ) ∈ B ∗ A i , j V j \text{Output} = \sum_{(i,j) \in B^*} A_{i,j} V_j Output=(i,j)BAi,jVj


2. 计算示例

输入数据

假设 d = 2 d=2 d=2,输入如下:

  • Query (Q)
    Q = [ 1.0 2.0 3.0 4.0 ] Q = \begin{bmatrix} 1.0 & 2.0 \\ 3.0 & 4.0 \\ \end{bmatrix} Q=[1.03.02.04.0]
  • Key (K)
    K = [ 5.0 6.0 7.0 8.0 9.0 10.0 ] K = \begin{bmatrix} 5.0 & 6.0 \\ 7.0 & 8.0 \\ 9.0 & 10.0 \\ \end{bmatrix} K= 5.07.09.06.08.010.0
  • Value (V)
    V = [ 1.0 0.0 1.0 0.0 1.0 0.0 1.0 1.0 0.0 ] V = \begin{bmatrix} 1.0 & 0.0 & 1.0 \\ 0.0 & 1.0 & 0.0 \\ 1.0 & 1.0 & 0.0 \\ \end{bmatrix} V= 1.00.01.00.01.01.01.00.00.0

Step 1: 计算原始注意力分数 S = Q K T S = QK^T S=QKT

S = [ 1 ⋅ 5 + 2 ⋅ 6 1 ⋅ 7 + 2 ⋅ 8 1 ⋅ 9 + 2 ⋅ 10 3 ⋅ 5 + 4 ⋅ 6 3 ⋅ 7 + 4 ⋅ 8 3 ⋅ 9 + 4 ⋅ 10 ] = [ 17 23 29 39 53 67 ] S = \begin{bmatrix} 1 \cdot 5 + 2 \cdot 6 & 1 \cdot 7 + 2 \cdot 8 & 1 \cdot 9 + 2 \cdot 10 \\ 3 \cdot 5 + 4 \cdot 6 & 3 \cdot 7 + 4 \cdot 8 & 3 \cdot 9 + 4 \cdot 10 \\ \end{bmatrix} = \begin{bmatrix} 17 & 23 & 29 \\ 39 & 53 & 67 \\ \end{bmatrix} S=[15+2635+4617+2837+4819+21039+410]=[173923532967]

Step 2: 反对角线评分(假设块大小 2 × 2 2 \times 2 2×2

  • 块 1 S 1 : 2 , 1 : 2 S_{1:2,1:2} S1:2,1:2):
    反对角线元素 = { 17 , 53 } 和 = 17 + 53 = 70 \text{反对角线元素} = \{17, 53\} \quad \text{和} = 17 + 53 = 70 反对角线元素={17,53}=17+53=70
  • 块 2 S 1 : 2 , 2 : 3 S_{1:2,2:3} S1:2,2:3):
    反对角线元素 = { 23 , 67 } 和 = 23 + 67 = 90 \text{反对角线元素} = \{23, 67\} \quad \text{和} = 23 + 67 = 90 反对角线元素={23,67}=23+67=90

Step 3: 阈值块选择(假设 τ = 0.6 \tau = 0.6 τ=0.6

  1. 归一化
    P = softmax ( [ 70 , 90 ] ) ≈ [ 0.27 , 0.73 ] P = \text{softmax}([70, 90]) \approx [0.27, 0.73] P=softmax([70,90])[0.27,0.73]
  2. 选择关键块
    • 累积概率: 0.27 + 0.73 = 1.0 > τ 0.27 + 0.73 = 1.0 > \tau 0.27+0.73=1.0>τ,因此选择 块 2 S 1 : 2 , 2 : 3 S_{1:2,2:3} S1:2,2:3)。

Step 4: 稀疏注意力计算

仅计算块 2 的注意力权重:
A selected = softmax ( [ 23 , 67 ] 2 ) ≈ [ 0.0001 , 0.9999 ] A_{\text{selected}} = \text{softmax}\left(\frac{[23, 67]}{\sqrt{2}}\right) \approx [0.0001, 0.9999] Aselected=softmax(2 [23,67])[0.0001,0.9999]
加权聚合 V V V
Output = 0.0001 ⋅ [ 0.0 , 1.0 , 0.0 ] + 0.9999 ⋅ [ 1.0 , 1.0 , 0.0 ] ≈ [ 1.0 , 1.0 , 0.0 ] \text{Output} = 0.0001 \cdot [0.0, 1.0, 0.0] + 0.9999 \cdot [1.0, 1.0, 0.0] \approx [1.0, 1.0, 0.0] Output=0.0001[0.0,1.0,0.0]+0.9999[1.0,1.0,0.0][1.0,1.0,0.0]


3. 关键优势

  1. 计算高效:反对角线评分的计算复杂度低,仅需 O ( B 2 ) O(B^2) O(B2) 而非 O ( N 2 ) O(N^2) O(N2)
  2. 模式保留:反对角线能捕捉垂直/斜线依赖(如视频帧间的时空关联)。
  3. 动态适应性:通过阈值调整可平衡计算量与精度。

XAttention 在长文本和视频任务中可加速 13.5 倍,同时保持全注意力的精度。


文章转载自:

http://b5byFGTa.mspqw.cn
http://cLvBdSJN.mspqw.cn
http://7rdr00yw.mspqw.cn
http://3ZpBZduJ.mspqw.cn
http://7dF3b2Vl.mspqw.cn
http://1Q0Y4l0d.mspqw.cn
http://ssFsrfwB.mspqw.cn
http://NJ6UtNkV.mspqw.cn
http://xeaV9SOW.mspqw.cn
http://ONYmD0Oe.mspqw.cn
http://OQogMur5.mspqw.cn
http://Jl3uUMU7.mspqw.cn
http://uAlqu6Je.mspqw.cn
http://V067vT9B.mspqw.cn
http://vBK1JreN.mspqw.cn
http://S04XL0Eb.mspqw.cn
http://u5q8JuNo.mspqw.cn
http://sU8qgVk5.mspqw.cn
http://cIHiK9wh.mspqw.cn
http://CrVU3PiZ.mspqw.cn
http://M538A82t.mspqw.cn
http://Y8hOEMpM.mspqw.cn
http://iEPZzW2E.mspqw.cn
http://LwB5Hd19.mspqw.cn
http://wHsP2KZB.mspqw.cn
http://nBNLVt0F.mspqw.cn
http://0lqEkzTA.mspqw.cn
http://pHosQkzD.mspqw.cn
http://IFlyg7ry.mspqw.cn
http://rGd05lEQ.mspqw.cn
http://www.dtcms.com/wzjs/757747.html

相关文章:

  • 专业网站设计服务商wordpress标题翻译
  • 如何创建企业网站北京seo关键词排名优化
  • 江苏德丰建设集团网站室内设计师联盟网站
  • 长春专业做网站公司郑州做网站 汉狮网络
  • 周到的网站建站wordpress 文档中心
  • 做网站公司商丘企业网站建设可行性分析
  • 制作网站一年多少钱做翻译兼职的网站是哪个
  • 专业做网站报价工作流软件
  • 合肥生态丽景网站建设明天去广州需要隔离吗
  • 找个小网站如何弃掉wordpress版权
  • 如何自做网站为什么做网站会被批捕
  • 怎么在微信公众号建设微网站公司网站自己可以做吗
  • 合肥蜀山网站开发提供手机自适应网站
  • 厦门营销型网站建设杭州的互联网公司有哪些
  • 个体营业执照可以做网站嘛wordpress如何编辑器
  • 公司网站推广方法一份完整的个人简历模板
  • 网站设计主要内容做网站需要考虑什么
  • 郑州营销型网站设计运营征婚网站 女 做茶叶生意
  • 汕头百度网站推广网站推广营销的意义
  • 食品 网站源码潍坊高级网站建设价格
  • 小厂建网站做网站设计要适配到手机端么
  • 松江网站建设培训费用安阳网络推广
  • 网站建设经费管理六安网站关键词排名优化地址
  • 苏州注册公司可以用住宅地址吗株洲seo优化高手
  • 做美食网站需求分析报告简易网页一键生成
  • 制作微信网站模板app制作平台免费版下载
  • 做企业网站用什么cms好有赞微商城app官方下载
  • 神农架网站设计微信小程序制作教学
  • 佛山新网站制作代理商wordpress升级中文版
  • 向搜索引擎提交网站地图购物网站模板