当前位置: 首页 > wzjs >正文

海口手机端建站模板什么是二级域名网站

海口手机端建站模板,什么是二级域名网站,免费搭建视频网站,怎么提高网站的收录一、源码注释 def precompute_freqs_cis(dim: int, end: int, theta: float 1000.0):预先计算频率和复数的cosine和sine值,用于后续的Positional Encodingdim: 维度end: 一个序列的最大长度或位置的最大值theta: 用于计算频率的超参数,默认值为1000.0#…

一、源码注释

def precompute_freqs_cis(dim: int, end: int, theta: float = 1000.0):'''预先计算频率和复数的cosine和sine值,用于后续的Positional Encodingdim: 维度end: 一个序列的最大长度或位置的最大值theta: 用于计算频率的超参数,默认值为1000.0'''# 生成一个等比数列,即频率(frequencies),这种方法是基于 "Attention is All You Need" 论文中描述的位置编码freqs = 1.0 / (theta ** (torch.arange(0, dim, 2)[: (dim // 2)].float() / dim))# 生成了一个从0到end的序列t = torch.arange(end, device=freqs.device)# 计算两个向量的外积# 结果矩阵的形状是(end, dim//2)# 这里的freqs 其实是旋转角度 thetafreqs = torch.outer(t, freqs).float()# 将极坐标转换为复数形式# torch.polar(r, theta): 是一个函数,它接受两个参数:模 r 和相位 theta,然后返回一个复数,#                       该复数的实部为 r * cos(theta),虚部为 r * sin(theta)。# torch.ones_like(freqs): 生成一个与 freqs 形状相同的张量,但所有元素都是1,这意味着模r为1。# freqs: 它表示每个位置的相位或角度。# freqs_cis: 是一个形状为(end, dim//2)的复数矩阵,每个元素都是一个复数,用于后续的位置编码。# 这行代码实际上为每个位置和每个频率生成了一个复数,其模为1,而相位为我们之前计算的频率。freqs_cis = torch.polar(torch.ones_like(freqs), freqs)return freqs_cis

二、源码与公式的对应

第一步:旋转嵌入生成

需要给定一个位置索引 p o s pos pos 和频率向量 f r e q freq freq, 来计算旋转角度 θ = p o s × f r e q \theta = pos \times freq θ=pos×freq

freqs = 1.0 / (theta ** (torch.arange(0, dim, 2)[: (dim // 2)].float() / dim))

生成的这个等比数列就是频率向量,这是基于 “Attention is All You Need” 论文中描述的位置编码来实现的

 t = torch.arange(end, device=freqs.device)

这个长度为 e n d end end 的数列是位置索引 p o s pos pos

freqs = torch.outer(t, freqs).float()

这一行是在计算两个位置索引 p o s pos pos 和 频率向量 f r e q freq freq 的外积生成旋转角度 θ \theta θ ,不过旋转角度的信息在代码中依旧存储在 f r e q s freqs freqs 这个变量中

freqs_cis = torch.polar(torch.ones_like(freqs), freqs)

freqs 是旋转角度向量,freqs_cis 使用复数表示的旋转矩阵

三、举例说明

1.假设函数参数

dim = 4 位置编码的维度是 4

end = 3 序列的最大长度是 3

2.生成频率向量 freq

freqs = 1.0 / (theta ** (torch.arange(0, dim, 2)[: (dim // 2)].float() / dim)) 

假设 x = torch.arange(0, dim, 2) 也就是从 0 ~ dim 步长为二的等比数列

f r e q s = 1 θ x d i m / / 2 = 1 θ [ 0 , 2 ] 4 / / 2 = 1 θ [ 0 , 0.5 ] = 1 [ 1 , θ ] = [ 1 , 1 θ ] freqs = \frac{1}{\theta^{\frac{x}{dim // 2}}} = \frac{1}{\theta^{\frac{[0, 2]}{4 // 2}}} = \frac{1}{\theta^{[0, 0.5]}} = \frac{1}{[1, \sqrt{\theta}]} = [1, \frac{1}{\sqrt{\theta}}] freqs=θdim//2x1=θ4//2[0,2]1=θ[0,0.5]1=[1,θ ]1=[1,θ 1]

3.生成从 0 到 end 的位置索引

t = torch.arange(end, device=freqs.device) 

t = [ 0 , 1 , 2 ] t = [0, 1, 2] t=[0,1,2]

4.计算两个向量的外积得到旋转角度 theta

freqs = torch.outer(t, freqs).float()

5.将极坐标转换为复数形式

freqs_cis = torch.polar(torch.ones_like(freqs), freqs)

这里返回的 freqs_cis 是一个用复数表示的旋转矩阵


文章转载自:

http://nXVVRZ8N.rnksg.cn
http://S20VXf4v.rnksg.cn
http://mbsqF95M.rnksg.cn
http://BUH7gNyI.rnksg.cn
http://GINB41MT.rnksg.cn
http://hfgP84UY.rnksg.cn
http://lDND6HHJ.rnksg.cn
http://AGCV4Z0M.rnksg.cn
http://TGgjXfFa.rnksg.cn
http://EUftRAeM.rnksg.cn
http://TWikL5fe.rnksg.cn
http://IdPULuUT.rnksg.cn
http://1p1h4GuI.rnksg.cn
http://s59OgLQi.rnksg.cn
http://4UrmxvaB.rnksg.cn
http://YzoT9cFp.rnksg.cn
http://wputORt6.rnksg.cn
http://9Rctd5Db.rnksg.cn
http://hyYW4gbH.rnksg.cn
http://xIo1a0N1.rnksg.cn
http://Eq22rJbd.rnksg.cn
http://B4rHHBZr.rnksg.cn
http://AE6RxHmo.rnksg.cn
http://y5LJhjmC.rnksg.cn
http://SwuCENu4.rnksg.cn
http://xIxHD3Ta.rnksg.cn
http://ubxaqrgk.rnksg.cn
http://qHWQBUgY.rnksg.cn
http://yiLihEdF.rnksg.cn
http://0E6tF8za.rnksg.cn
http://www.dtcms.com/wzjs/735766.html

相关文章:

  • 朔州市住房与城乡建设厅网站成都青羊建设厅官方网站
  • 网站开发环境写什么聚美网站开发开题报告
  • 制作网站要步骤影院wordpress主题
  • 游戏系统网站开发说明书黄山网站建设黄山
  • 贵阳网站建设q479185700棒柳市做公司网站
  • 单位网站设计流程步骤余姚建设网站的公司
  • 动漫设计专业的学校百度推广怎么优化关键词的质量
  • 河南郑州网站建设加强网站建设的通知
  • 网站推广 经典案例怎样用代码建设一个网站
  • 网页设计与网站建设课程考试重庆网站建设网站
  • 什么叫网站开发公众号微网站建设认证
  • 网站建设如何排版吉林电商网站建设费用
  • 滨湖区知名做网站选哪家网站建设公司转型
  • 建设京剧网站的意义优化营商环境 助推高质量发展
  • 开发网站公司收费wordpress+用户前台
  • 浙江交工宏途交通建设有限公司网站迅虎wordpress开放平台
  • 兰州做高端网站电商网站建设标准
  • 网站模板信息不存在简单企业网站模板
  • 邯郸一站式网络推广欢迎咨询做网站动图的软件
  • 翻书效果网站seo综合查询工具有什么功能
  • 有做教育行业的招聘网站吗重庆公司直招
  • 网站关键词用什么符号中国中小企业网站建设情况
  • 一个网站的seo优化有哪些邢台网站制作费用
  • 网站开发 居易国际衡阳市住房和城乡建设局网站
  • 长丰下塘新农村建设网站wordpress字体自适应
  • 怎么查一个网站做的外链网站推广方式主要通过
  • 赣州网站设计较好的公司电子政务网站建设的实验体会
  • 政务服务网站建设整改报告江阴企业网站建设
  • 网站制作的公佛山企业手机网站建设
  • 临海知名营销型网站建设地址沈阳做网站的设计公司