当前位置: 首页 > news >正文

RNN、LSTM、Transformer推荐博文

最近在了解RNN、LSTM、transformer的相关原理,看了一些博文,下面做一点记录,以方便自己或者感兴趣的朋友查阅。
如果后续看到别的好的,也可能会更新或者添加在评论里。

RNN:
1.【循环神经网络(RNN)从零开始完整教程】
里面有个小实践,正弦波序列预测。代码格式非常规范,很容易理解。
使用pytorch实现

2.一步一步学RNN:从入门到实践指南
从基础到稍微深一点的应用,都给出了一些小实践。
使用tensorflow实现

3.Pytorch循环神经网络(RNN)快速入门与实战
对语句解释十分详细,文中提到的文章也都很不错,有空可以看看。
使用pytorch实现了对航线的预测。
代码中,有个画3D图的环节,如果不能正常画出3D图,需要把这句话ax = Axes3D(fig) 改成ax = fig.add_subplot(111, projection=‘3d’),原语句出问题的原因是,matplotlib新版的用法更加规范
另,plt画图需要用到中文时,记得下中文文字库,不然容易显示错误。要不直接title、label之类全部用英文。

4.循环神经网络(RNN)
这个网站(名叫菜鸟教程)还蛮推荐的,还有很多其他资源。
这篇里面对结构的解释蛮简介的,基本结构形式的代码也有基本展示。要是结构图能有图示就更好了。

LSTM:
LSTM是在RNN基础上,为了解决梯度消失和爆炸的问题,主要引入输入门、遗忘门、输出门。RGU则是对LSTM的简化
1.一个很有名的blog
介绍LSTM基本原理的blog

2.理解Pytorch中LSTM的输入输出参数含义
对参数的维度、语句等有一个较好的解释

Transformer:
1.【超详细】【原理篇&实战篇】一文读懂Transformer
这篇博文的参考文章也非常多,建议可以看看。

2.三万字最全解析!从零实现Transformer(小白必会版😃)
非常详细,有的不懂的,可以边看边搜,代码过一遍,理解会好很多。
这个作者在他别的博文里,还写了一些实践,有时间可以试试。

http://www.dtcms.com/a/307068.html

相关文章:

  • AI在软件测试中的应用:自动化测试框架、智能缺陷检测与A/B测试优化
  • 人工智能如何改变项目管理:应用、影响与趋势
  • 无监督MVSNet系列网络概述
  • 并查集算法:Python实现与工程实践指南
  • 如何协调跨部门资源?核心要点分析
  • Java String类练习
  • 客户满意度调查:助力商场提升运营效能​(客户满意度调查)
  • 8.Linux : 日志的管理与时钟同步的配置
  • 代码随想录算法训练营第五十六天|动态规划part6
  • 手动 对列表字段进行排序
  • 【高等数学】第七章 微分方程——第四节 一阶线性微分方程
  • LNN+XGBoost:优化多层供应链订购:缓解牛鞭效应
  • C++STL系列之bitset
  • Git——分布式版本控制系统
  • #C语言——学习攻略:深挖指针路线(四)--字符指针变量,数组指针变量,二维数组传参的本质,函数指针变量,函数指针数组
  • ConvertX:自托管的在线文件转换器,支持1000+种格式!
  • Linux系统编程Day1-- 免费云服务器获取以及登录操作
  • CH347使用笔记:CH347作为FPGA下载器的几种方式
  • Maven 配置阿里云镜像加速
  • huggingface是什么?2025-07-30
  • Mac 上配置jdk 环境变量
  • 2. Agent与 React流程
  • 【LY88】双系统指南及避坑
  • Python 的 match-case
  • 从映射到共生:元宇宙、物联网与AI的智能融合生态图谱
  • (LeetCode 面试经典 150 题) 141. 环形链表(快慢指针)
  • HPCtoolkit的下载使用
  • Oracle11g数据库迁移达梦8数据库方案
  • Python序列化和反序列化
  • 如何用Docker部署ROS2