当前位置: 首页 > news >正文

Transformer以及BERT阅读参考博文

Transformer以及BERT阅读参考博文

Transformer学习:

已有博主的讲解特别好了:

  1. 李沐:Transformer论文逐段精读【论文精读】_哔哩哔哩_bilibili
  2. 知乎:Transformer模型详解(图解最完整版) - 知乎

个人杂想:

  1. Q K T ∗ V QK^{T}*V QKTV中, Q K T QK^T QKT其实可以理解为相似性矩阵S,那么 S ∗ V S*V SV其实就相当于相似性矩阵对原始的嵌入加权求和。这感觉就是GAT的一个思想源泉。
  2. 残差连接和concat挺重要的

BERT

  1. BERT模型架构详解 - 知乎

  2. 李沐:BERT 论文逐段精读【论文精读】_哔哩哔哩_bilibili

http://www.dtcms.com/a/15835.html

相关文章:

  • 浏览器安全学习
  • NLLB 与 ChatGPT 双向优化:探索翻译模型与语言模型在小语种应用的融合策略
  • Windows 图形显示驱动开发-WDDM 2.0 -Gpu段
  • pip安装国内镜像加速方法
  • 【操作系统】操作系统结构
  • 51单片机09 DS1302时钟
  • 人工智能之数学基础:线性空间
  • DeepSeek官方发布R1模型推荐设置
  • 重生之我在异世界学编程之C语言:深入指针篇(上)
  • 大数据SQL调优专题——Hive执行原理
  • Nginx--日志(介绍、配置、日志轮转)
  • Qt QOpenGLShaderProgram详解
  • 完美解决 error:0308010C:digital envelope routines::unsupported
  • ArcGIS Pro显示缓存空间不足导致编辑或加载数据显示不完全
  • duckdb导出Excel和导出CSV速度测试
  • 微信小程序 - 分包加载
  • 黑魔法(BMD)存储卡格式化后的恢复方法
  • 【IEEE/EI/CPCI检索】2025年第四届信号处理、信息系统与网络安全国际会议(SPISCS 2025)
  • vLLM启用笔记
  • 常用排序算法
  • SPSS—回归分析
  • 基于SpringBoot+Vue的科研项目验收管理系统的设计与实现(源码+SQL脚本+LW+部署讲解等)
  • React 第二十五节 <Fragment></Fragment> 的用途以及使用注意事项详解
  • 基于 MATLAB 的粒子滤波算法实现示例,用于处理手机传感器数据并估计电梯运行参数。
  • 回归预测 | Matlab实现PSO-HKELM粒子群算法优化混合核极限学习机多变量回归预测
  • MySQL篇之对MySQL进行参数优化,提高MySQL性能
  • Mac ARM 架构的命令行(终端)中,删除整行的快捷键是:Ctrl + U
  • 基于微信小程序校园订餐的设计与开发(ssm论文源码调试讲解)
  • Nginx之rewrite重写功能
  • 嵌入式硬件篇---原码、补码、反码