当前位置: 首页 > wzjs >正文

做网站团队的人员安排百度seo价格

做网站团队的人员安排,百度seo价格,网站建设站建设好吗,重庆沙坪坝区疫情最新消息先介绍几个之前的PE: 1. Absolute Positional Embedding 比如 Transformer原论文中的PE。 问题:理论上讲,位置1,2对应的PE应该在距离上比位置1,500的PE更接近,但APE做不到这一点。 2.Relative Position…

先介绍几个之前的PE:

1. Absolute Positional Embedding

比如 Transformer原论文中的PE。

问题:理论上讲,位置1,2对应的PE应该在距离上比位置1,500的PE更接近,但APE做不到这一点。

2.Relative Positional Embedding

解决了APE中的问题,但也带来了计算效率低下等问题。此处不对RPE做详细介绍

3.Learned Positional Embedding

每个位置的PE通过学习得到。

问题:如果训练集中的Sequence Length都是512以内,那么当推理时遇到长度长于512得到sequence时,就会出问题了。

4.Rotary Positional Embedding

不太懂旋转矩阵的可以参考这个链接

RoPE怎么做的?请看:
在这里插入图片描述
当embedding维度为2时,position的位置每往后一个,就把embedding对应维度旋转θ角度,这就是RoPE的核心思想。

再看论文的公式13:
在这里插入图片描述
其中 x m x_m xm表示位置 m m m处的embedding(由embedding层得到,还不含PE信息); { q , k } \{q,k\} {q,k}表示得到的是 q q q或者 k k k的表示(不含 v v v)。

矩阵乘法的后两项,就是把二维的embedding映射到 q q q k k k的简单映射(四个W都是标量)。这里的操作和Attention Is All You Need中得到 q q q或者 k k k的操作是完全一样的(如果去掉Attention Is All You Need中的PE的话)。

而矩阵的第一项,就是把矩阵做一个简单的旋转,这一点我们已经提到过了。

当embedding维度大于2的时候怎么办呢?我们只需要将维度2个2个地进行旋转就行了:
在这里插入图片描述
原始论文也对这一过程进行了图解说明:
在这里插入图片描述

参考链接

参考链接1
参考链接2
参考链接3

http://www.dtcms.com/wzjs/457498.html

相关文章:

  • 网站做外链免费创建个人博客网站
  • c2c网站的主要功能软文优化
  • WordPress url 数据表搜索引擎优化概述
  • 网络设计采用的方法和原则seo 工具分析
  • 企业培训平台太原seo排名收费
  • wordpress 图片站seo营销软件
  • 医学招聘网站开发区游戏推广代理加盟
  • 做目的旅游网站的百度网首页官网
  • 网站标签中的图片怎么做的企业域名查询
  • 濮阳网站建设在哪做seo怎么优化排名
  • Wordpress菜单的页面不显示武汉seo网站排名优化公司
  • 如何做下载网站赚钱吗网站优化seo是什么
  • 网站建设banner图片中国职业技能培训中心官网
  • 支付宝手机网站支付湖南竞价优化专业公司
  • asp.net开发网站好不好百度网址是多少 百度知道
  • 楼市最新消息2023seo平台有哪些
  • 自己做资讯网站黄冈网站推广厂家
  • 怎么免费做网站不要域名营销方案案例范文
  • 石家庄免费网站建设百度2023免费
  • 智慧团建入口登录网站沈阳百度seo排名优化软件
  • 如何自己建站网站制作百度搜索简洁版网址
  • 用什么网站做一手楼好策划品牌全案
  • 旅游网站框架代码优化
  • 网站布局策划案中国十大互联网公司
  • .net程序员网站开发工程师百度上做优化
  • 泰安企业做网站哪家公司建设网站好
  • 福州网站制作建设廊坊seo排名扣费
  • 刚接触网站建设有哪些问题如何进行网络营销策划
  • 泉州做网站360免费做网站
  • 简述网站建设及维护的全过程免费网页在线客服系统代码