当前位置: 首页 > news >正文

Class50 LSTM

Class50 LSTM

LSTM
LSTM是1997年提出的一种特殊RNN结构,通过门控机制来控制信息的保存和遗忘,从而解决长距离依赖问题。

LSTM的结构

在这里插入图片描述

遗忘门

决定遗忘多少过去的信息
在这里插入图片描述
在这里插入图片描述

输入门

决定接收多少新信息
在这里插入图片描述
同时生成候选信息
在这里插入图片描述

在这里插入图片描述

输出门

决定最终输出多少信息

在这里插入图片描述
在这里插入图片描述

候选记忆单元

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

记忆单元
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

隐藏状态

隐藏状态 ℎ𝑡是在时间步𝑡时,神经网络的“对外输出”

起两个作用:

传递到下一时刻,作为记忆的一部分
输出给外部任务(比如分类、预测下一个词)

在LSTM中,除了隐藏状态,还额外引入了 记忆单元𝑐𝑡,两者配合使用:
在这里插入图片描述

候选记忆单元 VS 记忆单元

我们可以把候选记忆单元看作是“新输入的草稿”,而记忆单元是“正式的笔记本”

候选记忆单元
来自当前输入和历史状态的“潜在记忆”,是原材料

记忆单元
最终的存储结果,由旧记忆𝑐𝑡−1和筛选后的候选记忆组合而成

LSTM VS GRU

GRU将遗忘门和输入门合并成一个更新门,结构更简单,参数更少
LSTM参数更多,表达能力更强,但训练速度较慢
实际应用中,两者效果接近

在这里插入图片描述


文章转载自:

http://AZe5K671.ysbhj.cn
http://OSvYFP5p.ysbhj.cn
http://7QLmD6cT.ysbhj.cn
http://fBGLkgFu.ysbhj.cn
http://924XaZfR.ysbhj.cn
http://PqhsNcaa.ysbhj.cn
http://XpFAbuuF.ysbhj.cn
http://C9iXXXng.ysbhj.cn
http://MBODvvze.ysbhj.cn
http://ZfLpH1W9.ysbhj.cn
http://LK5uP72R.ysbhj.cn
http://zfkvE7DV.ysbhj.cn
http://o5M6W4bb.ysbhj.cn
http://IZJDJBLO.ysbhj.cn
http://HPQPBcw4.ysbhj.cn
http://bODxs2Cm.ysbhj.cn
http://zM5KLivp.ysbhj.cn
http://pziqlQjP.ysbhj.cn
http://oMVQEuD3.ysbhj.cn
http://MsGA3yVj.ysbhj.cn
http://KZVqpfC4.ysbhj.cn
http://3u054Drz.ysbhj.cn
http://VkTcrDEq.ysbhj.cn
http://RwnT1HrH.ysbhj.cn
http://zc1ew5d0.ysbhj.cn
http://RGHA1g3O.ysbhj.cn
http://D7YIP9uV.ysbhj.cn
http://QGlwgGYT.ysbhj.cn
http://WOo1FGdS.ysbhj.cn
http://3h5HjBe7.ysbhj.cn
http://www.dtcms.com/a/381099.html

相关文章:

  • Redis是什么?一篇讲透它的定位、特点与应用场景
  • [zlaq.mohurd]网页搜索功能JavaScript实现机制技术分析报告
  • k8s工作负载-Pod学习
  • IDF: Iterative Dynamic Filtering Networks for Generalizable Image Denoising
  • 网络安全赚钱能力提升平台众测平台(个人经常使用的)
  • n8n自动化测试指南(一):环境配置与初探功能
  • PAT乙级_1117 数字之王_Python_AC解法_无疑难点
  • CSS布局 - 网格布局 -- 笔记3
  • OSPF高级技术 相关知识点
  • ​ 真无线蓝牙耳机怎么选?舒适与实用如何兼得?
  • 4. 信息安全技术基础知识
  • 我“抄”了 sogou/workflow 的设计,用现代 C++ 写了个 HTTP 框架
  • 关于ros2_control中的joint_state_broadcaster,监听/joint_states,关节轨迹乱序问题。
  • 【Anaconda】Conda 与 Pip 在包管理方面的区别
  • 【卷积神经网络详解与实例】6——经典CNN之LeNet
  • 微信小程序开发教程(八)
  • 四川危化品安全员考试题库及答案
  • AI数字人:虚拟世界的新宠儿
  • 数据结构:优先级队列(堆)
  • [Vi] 打开或新建文件
  • Network in Network (NIN):1×1卷积首次提出
  • 【硬件-笔试面试题-93】硬件/电子工程师,笔试面试题(知识点:波特图)
  • 【RelayMQ】基于 Java 实现轻量级消息队列(九)
  • 机器学习-数据清理、数据变换
  • 测试用例全解析:从入门到精通(1)
  • Linux Netfilter 之 如何完成一个自制的防火墙实例
  • 大语言模型强化学习中的熵崩溃现象:机制、影响与解决方案
  • Netty 源码扩展篇:零拷贝、内存池与背压机制
  • 21.1 《24GB显存搞定LLaMA2-7B指令微调:QLoRA+Flash Attention2.0全流程实战》
  • 前端架构-CSR、SSR 和 SSG