当前位置: 首页 > news >正文

【图文详解】论文《Attention Is All You Need》中位置嵌入(Positional Encoding)的流程和作用

文章目录

  • 前言
  • 一、位置嵌入(Positional Encoding)的流程
  • 二、位置嵌入的作用
  • 三、为什么采用正弦和余弦函数
  • 四、位置嵌入示例
  • 五、结论

前言

亲爱的家人们,创作很不容易,若对您有帮助的话,请点赞收藏加关注哦,您的关注是我持续创作的动力,谢谢大家!有问题请私信或联系邮箱:fn_kobe@163.com

在 Transformer 结构中,位置嵌入(Positional Encoding, PE) 是用来弥补模型缺乏序列信息的问题。由于 Transformer 没有像 RNN 那样的循环结构,它不能像 RNN 那样隐式捕捉输入序列中单词的位置信息,因此需要显式地注入单词的位置信息,即位置嵌入。

一、位置嵌入(Positional Encoding)的流程

在这里插入图片描述
在这里插入图片描述

二、位置嵌入的作用

在这里插入图片描述

三、为什么采用正弦和余弦函数

在这里插入图片描述
在这里插入图片描述

四、位置嵌入示例

在这里插入图片描述

五、结论

在这里插入图片描述

相关文章:

  • 关于回溯算法中的剪枝是否需要for循环的总结归纳
  • 51c嵌入式~电路~合集12
  • DeepSeek开源周Day4:三连发!突破 AI 训练瓶颈的立体解决方案,并行计算三剑客DualPipe、EPLB与Profile-data
  • 设计模式之责任链模式
  • Redis安装及其AnotherRedisDesktopManagera安装使用
  • Ubuntu 下 nginx-1.24.0 源码分析 - ngx_init_cycle 函数 - 详解(4)
  • 【湖北省计算机信息系统集成协会主办,多高校支持 | ACM出版,EI检索,往届已见刊检索】第二届边缘计算与并行、分布式计算国际学术会议(ECPDC 2025)
  • python-leetcode 46.从前序与中序遍历序列构造二叉树
  • Django应用的高级配置和管理
  • 短剧平台世纪对决:爱奇艺能否掀翻红果?
  • 使用 VSCode 代替 BeyondStudio for NXP 开发 JN 5169
  • 从零开始的python学习(五)P63+P64+P65+P66
  • RabbitMQ系列(六)基本概念之Routing Key
  • 【Linux】进程间通信——共享内存
  • 一周一个Unity小游戏2D反弹球游戏 - 移动的弹板(触屏版)
  • Python--模块(上)
  • IoT 测试:智能互联时代的质量保障
  • DeepSeek-V3后训练揭秘:如何通过监督微调和强化学习提升模型性能
  • 为什么要进行软件测试?
  • 将宇宙不同温度下的能量表现形式 类比为量子计算机的波函数解码过程
  • 孟夏韵评《无序的学科》丨误读与重构的文化漂流
  • 上海博物馆展览进校园,“小先生”传递文物知识
  • 世界数字教育大会发布“数字教育研究全球十大热点”
  • 泉州围头湾一港区项目炸礁被指影响中华白海豚,官方:已叫停重新评估
  • 昆明公布3起经济犯罪案例:一人持有820余万假美元被判刑十年
  • 湖北宜化拟斥资超32亿加价回购“弃子”,布局上游煤炭业务