当前位置: 首页 > news >正文

Day32_【 NLP _2.RNN及其变体 _(2) LSTM】

        长短期记忆结构(LSTM, Long Short-Term Memory),它是循环神经网络(RNN)最重要的改进之一,专门设计用来解决标准RNN的长期依赖问题

相比传统RNN:

  • 优点
    • 适用长序列任务
    • 缓解梯度消失或爆炸
      • 细胞状态中加法运算
      • 遗忘门少连乘
  • 缺点
    • 结构复杂效率慢
    • 不能完全解决梯度消失或爆炸
    • 不能并行
      • 串行

一、结构

分为遗忘门、输入门、细胞状态、输出门

门值:好比一扇门开合的大小程度,门值都将作用在通过该扇门的张量,使用sigmoid,值为0-1(好比概率)

1.遗忘门

作用在上一个时间步的细胞状态之上,表示对上一个时间步信息遗忘多少。

2.输入门

输入门作用在当前时间步输入上,表示对当前时间步输入选择性输入。

  • 公式
    • 输入门门值公式
      • 对输入信息进行过滤
    • 传统RNN内部结构计算
      • 得到当前时间步未更新的细胞状态

3.细胞状态

更新当前细胞状态,保存历史数据状态,保证长序列下保存良好

4.输出门

作用在更新后的细胞状态上,

  • 公式1 门值
  • 公式2 使用这个门值产生隐含状态h(t)

二、API

nn.LSTM(input_size, hidden_size, num_layers)
input = (seq_len, batch_size, input_size)
h0 = (num_layers, batch_size, hidden_size) 
c0 = (num_layers, batch_size, hidden_size)

http://www.dtcms.com/a/490744.html

相关文章:

  • 重庆建站模板代理怎么做p2p网站
  • iis配置网站是什么网站建设方案书阿里云模板
  • 【计算机视觉】SAM 3 技术深潜:从“分割万物”到“理解概念”的范式转移
  • 「深度学习笔记3」概率论深度解析:从不确定性到人工智能的桥梁
  • 齐河专业企业网站建设做网站引流到天猫
  • 技术贴!【谷歌浏览器】实用工具推荐之谷歌浏览器(Google Chrome)离线纯净版完全安装指南:告别广告与捆绑骚扰
  • Centos7 自建Umami-开源免费的网站访问流量统计分析平台
  • 申威架构安装Java 11 RPM包教程:java-11.0.7-swjdk-11u-8.ky10.sw_64.rpm详细安装步骤
  • 【STM32项目开源】基于STM32的人体健康监测系统
  • 一个做礼品的网站国外网站用什么dns
  • 东莞 网站建设网站定制制作公司
  • Python 线程 类比c++【python】
  • 舆情监测的底层逻辑与技术方法探析
  • 谈谈redis的持久化
  • 网站建设进度深圳网站建设制作营销
  • SSM高校学生社团管理系统n4pcu(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。
  • 强化学习_Paper_2000_Eligibility Traces for Off-Policy Policy Evaluation
  • Kubernetes秘钥与配置管理全解析
  • Python 匿名函数、map、filter、sort 用法详解
  • wordpress 4.0 伪静态seo优化一般优化哪些方面
  • 上海自助模板建站wordpress被黑
  • 数据可视化延迟实时大屏优化:WebSocket增量传输+Canvas渲染数据延迟压缩至300ms
  • TimerFd Epoll
  • 百度网盘怎么实现不限速的高速下载?
  • UltraEdit做网站教程定制开发网站如何报价单
  • 《彻底理解C语言指针全攻略(5)--指针和函数专题》
  • 广州做网站找哪个公司好建设网络道德教育网站不包括
  • TUP及ESOP动态股权激励:算法是核心
  • 数据库知识全解析:从基础概念到MySQL实战
  • Python - 100天从新手到大师:第五十七天获取网络资源及解析HTML页面