当前位置: 首页 > news >正文

戴尔官方网站建设启示上海网站建设乐云seo模板中心

戴尔官方网站建设启示,上海网站建设乐云seo模板中心,柳市网站制作,设计类素材网站1.视频1:self-Attention|自注意力机制 |位置编码 | 理论 代码 注意: q-查询; k-商品标签; v-值(具体商品) * 不是指乘法,类似概念 a1:相似度; b1:总分 若想…

1.视频1:self-Attention|自注意力机制 |位置编码 | 理论 + 代码

注意:

q-查询; k-商品标签; v-值(具体商品)

* 不是指乘法,类似概念

a1:相似度; b1:总分

 

若想了解 I   这个词  与其他词的相似度,则用q1分别乘以 k2,k3,k4

若想了解 dog   这个词  与其他词的相似度,则用q4分别乘以 k1,k2,k3

注意:

(1,4,2)  1 表示一个batch size, 4表示一个token, 2表示每个token的长度

位置编码

因为self-attention的输出没有位置信息, 将a4放在最后一个输出的b4,  与  将a4 放在第一个输出的b4,   两个b4完全相同,没有包含位置对其的影响(没有包含位置信息)

 

一共有j个token, 每个token都有i个维度,

对于奇数维度的位置编码,使用cos 生成

对于偶数维度的位置编码,使用sin 生成

2. 视频2:Multi-Head Attention | 算法 + 代码

 

上一节课讲的是 single head

这节课将multi-head,   其中 h表示head的个数

讲了 几种q,k,v的计算方法

方法1:见上个图片,w1 2x6  分成三份(每份 2x2),分别与ai相乘,分别生成三份q,每个q 1x2

方法2:先使用统一的权重, 生成q,k,v, 然后再将q,k,v, 分别切分多个 ,如q切分为q1,q2,q3,q4,q5。

形成多个head

对于每个head,向上一节课那样,分别生成b1,b2...bm

 将得到的b先按列concat,  再按行concat,  得到一个mxd 的矩阵

m表示token的个数;d表示每一个token的维度

代码实现

首先定义一个x,   (1,4,2)

1表示batch size

4表示token个数

2表示token 

 

 

实例化一个类,传入三个参数

第一个参数:dim_in表示输入中每个token的维度(即输入x的最后一个维度)

第二个参数:d_model表示如果使用single self-attention  时,qkv总的向量长度

第三个参数:num_heads表示指定head的个数

指定qkv的总向量长度为6;指定一共有3个head;

所以每个head的维度等于 6/3=2,

定义三个全连接层,分别从输入x中提取qkv

表示每个head的维度 dk

从三个全连接层分别提取q,k,v

提取的qkv的维度等于d_model   即6,  (1,4,6)

将其reshape, 将6拆分为3x2

(1,4,3,2)

3表示3个head

将3进行移动,得到

(1,3,4,2)

4,2表示每个head的qkv的维度,

此时即可以对每个head进行并行处理

第一行表示:

q乘以k的转置,再除以根号下dk,  得到相似度分数

(个人:这里感觉自已听得有问题,没有完全理解)

对dist的最后一个维度做softmax,  然后乘以v  得到b

将b的维度调整为(1,4,3,2)

4表示4个token

3表示3个head

2表示每个b的维度

再将(1,4,3,2)reshape成 (1,4,6)

b最后维度为6

再将b经过全连接层,得到最终结果  ,最终结果的维度也是(1,4,6)

个人:

听得比较迷糊

本来是想听听这个,看看能否理解YOLO11里面的PSA, 还是没有搞懂

 

参考资料:

1.self-Attention|自注意力机制 |位置编码 | 理论 + 代码_哔哩哔哩_bilibili

2.Multi-Head Attention | 算法 + 代码_哔哩哔哩_bilibili

http://www.dtcms.com/a/489688.html

相关文章:

  • 网站发帖功能怎么做网站开发语言识别
  • 青海高端网站建设多少钱aso优化排名推广
  • 两学一做考试网站农业企业网站模板
  • 网站开发商品管理表字段网址导航网站简单制作
  • 宿州市埇桥区建设局网站租车网站模版
  • 安顺网站开发公司徐州信息网最新消息
  • 网站网页怎么压缩广州自助公司建网站企业
  • 求个没封的w站2021不用下载wordpress出现百度抓取404页面
  • 网站3网合一是怎么做的化妆品网站建设策划方案
  • 教育系统网站cms怎么联系创意设计网站
  • 秦皇岛建网站商标注册查询网官网查询
  • 什么做网站做个多少钱啊专做定制的网站
  • 济南网站推广徽hyhyk1wordpress页面设置全屏
  • dz可以做旅游网站吗怎么推广自己的链接
  • 网上三维展馆网站是怎么做的中天建设集团有限公司营业执照
  • 电气毕业设计代做网站上线了小程序官网登录
  • 银川网站建设公司电话合肥肥东网站建设
  • 网站一片空白五站合一网站建设
  • 东莞公司建设网站制作抖音小程序推广计划怎么开通
  • 一等一网站建设郑州网络工程学院
  • 网站登陆界面psdjsp手机版网站开发
  • 太仓建设银行网站赶集网网站建设ppt模板
  • 电子商务网站建设实例做网站的设计文档怎么做
  • 住房和创新建设部网站如何注册一个自己的品牌
  • 江苏网站开发公司免备案免费域名
  • 新乡商城网站建设布吉做网站
  • 网站开发手把手外链博客网站
  • 安徽省建设干部学校网站建网页用什么软件
  • 代理网站推荐今天最火的新闻头条
  • 网站开发费入什么费用wordpress增加图片轮播