当前位置: 首页 > news >正文

【Pytorch✨】LSTM04 l理解长期记忆和短期记忆

1. C_t(长期记忆)的特点

它是细胞状态(Cell State),从 t=1 一直传到最后 。
更新方式
Ct = ft *Ct-1 + it *Ct

  • ft *Ct-1 → 旧记忆(经过遗忘门过滤)
  • it *Ct → 新记忆(经过输入门筛选)

关键点

  • C_t 只经过“加法”更新,不经过太多非线性变换,所以信息可以长期保留
  • 遗忘门 ft 可以让旧记忆部分保留很久(甚至很多时间步)
  • 它更像是一本“历史记录本”,有很强的跨时间步信息传递能力

类比

C_t 就像一个人的长期记忆库,你小时候的记忆、昨天的经历、今天早上的早餐……都可能存放在里面,除非你主动遗忘。


2. h_t(短期记忆)的特点

  • 它是输出状态(Hidden State),既包含当前时刻的重要信息,也受当前 C_t 调整

  • 计算方式

    • 先对 C_t 做一次 tanh 压缩(信息被过滤、范围限制)
    • 再用输出门 o_t 决定要输出多少

关键点

  • h_t 是每一步“加工过”的信息,带有很强的即时性
  • 因为每次都会重新计算,并且经过 tanh,所以 h_t 更容易受到当前输入和当前状态影响
  • 不适合长时间保留细节信息,更适合传递“当前时刻的精华”

类比

h_t 就像你现在正在和别人对话时,能马上说出口的内容,它依赖于你的长期记忆(C_t),但会根据当前情境提取一部分。


3. 总结对比

对象全称作用保留时间更新方式类比
C_tCell State长期记忆很久(跨多个时间步)遗忘门 + 输入门(加法更新)长期记忆库
h_tHidden State短期记忆 / 当前输出当前时间步(下一步会重新生成)输出门 + tanh当前说出口的话
http://www.dtcms.com/a/313828.html

相关文章:

  • 计算机视觉(1)-图像采集设备选型全景表(工业 + 医疗 + 车载)
  • 编程算法:技术创新与业务增长的核心驱动力
  • 【Spring AI快速上手 (一)】ChatModel与ChatCilent构建对话
  • Rust:如何开发32位的DLL动态库
  • 单向链表(补充)与linux虚拟机网络配置
  • JS--获取事件的子元素与父元素
  • ZooKeeper 深度实践:从原理到 Spring Boot 全栈落地
  • 【unitrix】 7.1 二进制位加法(bit_add.rs)
  • 哪些第三方 Crate 可以直接用?
  • Mac桌面仿制项目--让ai一句话生成的
  • Qt 使用QtXlsx库处理Excel文件
  • Druid学习笔记 01、快速了解Druid中SqlParser实现
  • 赛灵思ZYNQ官方文档UG585自学翻译笔记:General Purpose I/O (GPIO)通用输入 / 输出
  • Linux文件权限管理全解
  • Java Getter 与 C# Getter 比较
  • WPF中引用其他元素各种方法
  • AUTOSAR AR-Explorer正式发布
  • C语言的数组与字符串
  • 从物理扇区到路径访问:Linux文件抽象的全景解析
  • 读写分离有那些坑?
  • 【企业架构】TOGAF概念之三
  • 【Linux | 网络】网络层(IP协议、NAT技术和ICMP协议)
  • 大模型 与 自驾 具身 3D世界模型等相关知识
  • GaussDB 数据库架构师(十二) 资源规划
  • 音视频文案字幕一键提取,免费使用,效率软件!
  • 开源的现代数据探索和可视化平台:Apache Superset 快速指南 Quickstart
  • 大模型探秘–AI 感知世界:从对话到掌控的交互革命
  • 13015计算机系统原理-速记宝典
  • 【Linux操作系统】简学深悟启示录:进程初步
  • Apache IoTDB(3):时序数据库 IoTDB Docker部署实战