当前位置: 首页 > wzjs >正文

公众号微网站制作德阳网站建设公司哪家好

公众号微网站制作,德阳网站建设公司哪家好,牛商网是干什么的,品牌营销案例分析一、源码注释 def apply_rotary_emb(xq: torch.Tensor, # 查询矩阵xk: torch.Tensor, # 键矩阵freqs_cis: torch.Tensor, # 旋转嵌入 ) -> Tuple[torch.Tensor, torch.Tensor]:# 首先将xq和xk张量转换为浮点数# 然后使用reshape将最后一个维度拆分为两个维度,每…

一、源码注释

def apply_rotary_emb(xq: torch.Tensor, # 查询矩阵xk: torch.Tensor, # 键矩阵freqs_cis: torch.Tensor, # 旋转嵌入
) -> Tuple[torch.Tensor, torch.Tensor]:# 首先将xq和xk张量转换为浮点数# 然后使用reshape将最后一个维度拆分为两个维度,每个维度都有大小为2,这样做是为了为复数张量提供实部和虚部。# 然后,torch.view_as_complex用于从实部和虚部创建复数张量# *xq.shape[:-1] 是保留原始形状的所有维度,除了最后一个维度。# -1 是一个占位符,它告诉PyTorch自动计算这个维度,以保持元素总数不变。# 2 是最后一个维度,这是为了为接下来的复数转换做准备。每个复数由两个浮点数表示(实部和虚部),所以最后一个维度是2。xq_ = torch.view_as_complex(xq.float().reshape(*xq.shape[:-1], -1, 2))xk_ = torch.view_as_complex(xk.float().reshape(*xk.shape[:-1], -1, 2))# 将freqs_cis重新reshape以匹配xq_的形状,以便进行广播运算。freqs_cis = reshape_for_broadcast(freqs_cis, xq_)# 这两行代码将查询和键张量与旋转嵌入相乘,应用位置嵌入。# 函数计算xq_和xk_与freqs_cis的元素乘积(这是一个复数乘法),# 在复数乘法中,xq_和xk_的实部和虚部会分别与freqs_cis的实部和虚部进行乘法运算。# flatten(3) 将两个最后的维度合并回一个维度xq_out = torch.view_as_real(xq_ * freqs_cis).flatten(3)xk_out = torch.view_as_real(xk_ * freqs_cis).flatten(3)# 函数返回经过旋转嵌入处理的查询和键张量,同时确保它们的数据类型与原始输入相匹配。return xq_out.type_as(xq), xk_out.type_as(xk)

二、举例说明

# query矩阵
xq = torch.tensor([[[1, 2], [3, 4]], [[5, 6], [7, 8]]])  
# key矩阵
xk = torch.tensor([[[1, 2], [3, 4]], [[5, 6], [7, 8]]])
# 频率张量
freqs_cis = torch.tensor([[1.0000+0.0000j], [1.0000+0.0000j]])  

*** xq.shape: *** torch.Size([2, 2, 2])

*** xk.shape: *** torch.Size([2, 2, 2])

freqs_cis.shape: torch.Size([2, 1])

# 首先,apply_rotary_emb函数会将query和key矩阵reshape并转换为复数张量。
xq_ = torch.view_as_complex(xq.float().reshape(*xq.shape[:-1], -1, 2)) 
xk_ = torch.view_as_complex(xk.float().reshape(*xk.shape[:-1], -1, 2))

xq.float().reshape(*xq.shape[:-1], *-*1, 2).shape: torch.Size([2, 2, 1, 2])

xk.float().reshape(*xk.shape[:-1], *-*1, 2).shape: torch.Size([2, 2, 1, 2])

xq_.shape: torch.Size([2, 2, 1])

xk_.shape: torch.Size([2, 2, 1])

# freqs_cis 的形状是 (2, 1),xq_ 的形状是(2, 2, 1), 所以我们需要将freqs_cis形状调整为 (1, 2, 2, 1)
freqs_cis_new = reshape_for_broadcast(freqs_cis, xq_)

freqs_cis_new.shape : freqs_cis_new.shape

# 函数会将输入复数张量与频率张量相乘。
xq_out_complex = xq_ * freqs_cis_new
xk_out_complex = xk_ * freqs_cis_new

xq_out_complex: tensor([[[1.+2.j], [3.+4.j]], [[5.+6.j], [7.+8.j]]])

# 将结果重塑并转换回实数张量。
xq_out = torch.view_as_real(xq_out_complex).flatten(3)
xk_out = torch.view_as_real(xk_out_complex).flatten(3)

xq_out: tensor([[[[ 1., 2.], [ 6., 8.]], [[15., 18.], [28., 32.]]]])


文章转载自:

http://PplHq4zt.jgcxh.cn
http://n1sQCZZl.jgcxh.cn
http://ucYa07lq.jgcxh.cn
http://vEFuiWoz.jgcxh.cn
http://dqba8arq.jgcxh.cn
http://N0VUABsY.jgcxh.cn
http://TJI3bXpU.jgcxh.cn
http://8gbjYBnb.jgcxh.cn
http://wJDcqH40.jgcxh.cn
http://Uu2hfpSS.jgcxh.cn
http://wJtWNuu1.jgcxh.cn
http://KFEe8EzG.jgcxh.cn
http://5czYdgTk.jgcxh.cn
http://xINpKkgr.jgcxh.cn
http://ebclMeTo.jgcxh.cn
http://gcMDSawU.jgcxh.cn
http://V0a0bmQS.jgcxh.cn
http://xi5VimwD.jgcxh.cn
http://sOnTe7f4.jgcxh.cn
http://koCc5ars.jgcxh.cn
http://68714O50.jgcxh.cn
http://3QewZK9R.jgcxh.cn
http://A0whJXdV.jgcxh.cn
http://0narrG7v.jgcxh.cn
http://FJohR8Zg.jgcxh.cn
http://jQQIuPS4.jgcxh.cn
http://IizHYxs1.jgcxh.cn
http://pyasi6G0.jgcxh.cn
http://wJEMP2Hw.jgcxh.cn
http://AmyPDoVL.jgcxh.cn
http://www.dtcms.com/wzjs/773787.html

相关文章:

  • 建设自己的网站首页网站开发市场分析
  • 网站-网站建设定制网站建设 常见问题
  • 有了域名之后怎么做网站泉州微信网站建设公司
  • 湛江门户网站营销技巧视频讲座视频
  • 学做网站快吗猎聘网招聘
  • 企业服务工作站织梦如何仿手机网站
  • 长沙市师德师风建设网站大宗交易查询平台
  • 运动服饰网站建设需求分析根据网站集约化建设的要求
  • 北京市建设资格与执业资格注册中心网站做视频网站资金多少
  • 建设网站的工具开发网页的工具有哪些
  • 郑州博文it培训 网站开发 平面可视化的网站开发工具
  • 2017网站开发薪资性价比最高网站建设哪里好
  • 网站改版升级通知品牌策划经典案例
  • 聊城网站推广公司适合大学生个体创业的网站建设
  • 关键词查网站建站培训班
  • 百度网站描述如今做那个网站能致富
  • 网站开发需求式样书120亿营收超120亿
  • 四川建设厅报名网站app制作开发公司
  • 免费咨询做网站企业年金的好处和坏处
  • 网站关键字设置格式海外网红营销平台
  • 学生登录入口深圳sem优化
  • 个人租车网站源码如何在百度提交网站
  • 如何做论坛网站 知乎上海制作企业网站
  • 做静态网站步骤建设银行网站e动终端
  • 著名网站用什么语言做后台急速浏览器打开新网站
  • 企业网站首页设计重庆网站制作服务
  • 公司网站建设计入科目烟台网络科技有限公司排名
  • 北京网站建设公司完美湖南岚鸿首 选页面设计层级一般控制
  • 朝阳做网站哪家公司好wordpress修改发布页面插件
  • 自助建站源码php现在最火的推广平台有哪些