当前位置: 首页 > news >正文

位置编码汇总 # 持续更新

看了那么多还没有讲特别好的,GPT老师讲的不错关于三角函数编码。

一、 手撕transformer常用三角位置编码

GPT说:“低维度的编码(例如,第一个维度)可以捕捉到大的位置差异,而高维度的编码则可以捕捉到小的细节差异”,好像是错的(说反了),我重新整理了下。

Query: 频率怎么看? 如果sin(wx) 那么i越小代表低维是吧,分母就越小 那么整体w就越大 w是不是频率 如果是 拿小维度频率更高呢 有可能我理解错了

Answer:

 13 【大模型面试 | 位置编码PE - 草莓师姐 | 小红书 - 你的生活指南】 😆 mO58Egl5lGXSLX9 😆 https://www.xiaohongshu.com/discovery/item/67ac12e4000000002802aa9e?source=webshare&xhsshare=pc_web&xsec_token=ABecXaiAShhTEnyF7pb2o-V49ONyIegFjiTjRo5qdXHUo=&xsec_source=pc_share

是不是有这个说法 如果用这种(三角)编码不方便LLM外推?

二、 手撕RoPE编码

无痛理解旋转位置编码RoPE

[通俗易读]无痛理解旋转位置编码RoPE(数学基础,理论(复数的指数表达,矩阵,几何意义),代码,分析) - 知乎

RoPE:旋转位置编码增强模型的输入长度外推能力 # 我艾神制作,必属精品

相关文章:

  • AI提示词:自然景区智能客服
  • 计算机网络知识点汇总与复习——(二)物理层
  • # 深度学习基础算法:NN、RNN、CNN
  • 机器学习-04-分类算法-04-支持向量机SVM-案例
  • 保姆级教程:synchronized 同步方法 vs 同步代码块,看完彻底懂锁!
  • QML-项目实战二
  • Ubuntu Live USB 如何使用
  • 《深度洞察:MySQL与Oracle中游标的性能分野》
  • 重新排序--区间问题--差分求频率,全开ll
  • 静态路由复习实验
  • MyBatis-Plus逆向工程
  • ORM框架
  • SQL Server安装后 SSMS 无法连接:身份验证模式错误
  • 可编辑36页PPT | “新基建”在数字化智慧高速公路中的支撑应用方案智慧高速解决方案智慧交通方案
  • 《C奥林匹斯宝典:基础篇 - 重载函数》
  • 机器人传感器系统---时间戳对齐
  • vue使用markdown-it-katex部分公式展示不正确 katex版本低
  • 深度学习--softmax回归
  • 基于TradingView和CTPBee的自动化期货交易系统实现
  • Saas产品性能优化实战
  • 俄乌直接谈判结束
  • 新任美国驻华大使庞德伟抵京履职,外交部回应
  • 杨文庄当选中国人口学会会长,曾任国家卫健委人口家庭司司长
  • 新闻1+1丨城市,如何对青年更友好?
  • 河南省委常委会会议:坚持以案为鉴,深刻汲取教训
  • “老中青少”四代同堂,季春艳携锡剧《玲珑女》冲击梅花奖