当前位置: 首页 > news >正文

位置编码再思考

最近在做多模态,发现基于 transformer 的多模态,position embedding 是一个非常重要的内容,而且还没有统一方案,先暂做记录,几篇还不错的博客:
Transformer学习笔记一:Positional Encoding(位置编码)
十分钟读懂旋转编码(RoPE)
图解RoPE旋转位置编码及其特性
一文读懂Transformer模型的位置编码
旋转式位置编码 (RoPE) 知识总结

怎么设计位置编码

因此,我们需要这样一种位置表示方式,满足于:
(1)它能用来表示一个token在序列中的绝对位置
(2)在序列长度不同的情况下,不同序列中token的相对位置/距离也要保持一致
(3)可以用来表示模型在训练过程中从来没有看到过的句子长度。
在这里插入图片描述
补充:
在这里插入图片描述
在这里插入图片描述
固定 i ,单从每个 PE(p, i) 看,沿着 i 轴,t 变化,是不断循环的三角函数,像这样:
在这里插入图片描述
在这里插入图片描述在这里插入图片描述
最终,
在这里插入图片描述

在这里插入图片描述
下图是一串序列长度为50,位置编码维度为128的位置编码可视化结果:
注意,纵向轴是位置 t,横向轴是 i,那么,可以发现,由于sin/cos函数的性质,位置向量的每一个值都位于[-1, 1]之间。同时,纵向来看,图的右半边几乎都是蓝色的,这是因为越往后的位置,频率越小,波长越长,所以不同的t对最终的结果影响不大。而越往左边走,颜色交替的频率越频繁。

相关文章:

  • AI一周热点事件(全球AI新闻-2025年3月17日至3月24日)
  • 2-1 MATLAB鮣鱼优化算法ROA优化LSTM超参数回归预测
  • Javaweb后端登录会话技术jwt令牌
  • 23种设计模式-结构型模式-适配器
  • 线程池参数如何设定?如何动态调整线程池?
  • 字符串交替合并问题
  • Mysql内置函数篇
  • 【Golang】第八弹----面向对象编程
  • 如何使用Python实现智能交通信号控制系统
  • [特殊字符] 2025蓝桥杯备赛Day13——P10984 [蓝桥杯 2023 国 Python A] 残缺的数字
  • DNA-PAINT
  • 基于javaweb的spring学生选课管理系统设计与实现(源码+文档+部署讲解)
  • 自动化逆向框架使用(Objection+Radare2)
  • 揭秘大数据 | 12、大数据的五大问题 之 大数据管理与大数据分析
  • Android Compose 框架隐式动画之过渡动画深入剖析(二十六)
  • ADB工具电视盒子刷机详细教程
  • 【c++入门系列】:引用以及内联函数详解
  • 2.Excel :快速填充和拆分重组
  • 【数组】长度最小数组
  • 【机器学习】从回声定位到优化引擎:蝙蝠算法在SVR超参数优化中的应用
  • 网站开发用台式机电脑配置/网站文章优化技巧
  • 做投标需要知道什么网站/百度指数功能模块有哪些
  • 重庆seo团队/aso如何优化
  • 深圳建设门户网站/中山疫情最新消息
  • php做学校网站免费下载/软文营销软文推广
  • 杭州电子商务公司排行/网站推广和seo