当前位置: 首页 > news >正文

GRU(门控循环单元) 笔记

文章目录

  • 1.什么是GRU
  • 2.GRU的内部结构
    • 2.1 重置门(Reset Gate)
    • 2.2 更新门(Update Gate)
    • 2.3 候选隐状态
    • 2.4 隐状态
  • 代码

1.什么是GRU

GRU(Gate Recurrent Unit)是循环神经网络(RNN)的一种,可以解决RNN中不能长期记忆和反向传播中的梯度等问题,与LSTM的作用类似,不过比LSTM简单,容易进行训练。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

先不看内部具体的复杂关系,将上图简化为下图:

在这里插入图片描述

结合xt 和 h(t-1),GRU会得到当前隐藏节点的输出y_{t}和传递给下一个节点的隐藏状态ht,这个ht的推导是GRU的关键所在,我们看一下GRU所用到的公式:
在这里插入图片描述

2.GRU的内部结构

在这里插入图片描述

2.1 重置门(Reset Gate)

r是重置门,重置门决定了如何将新的输入信息与前面的记忆相结合,它控制过去的信息是否重要。如果旧的信息很重要,就保留;如果不重要,就忽略。这有点像在“刷脑子”,看哪些旧记忆还需要用,哪些可以被新内容覆盖。

2.2 更新门(Update Gate)

它决定哪些信息需要更新,哪些不需要更新。你可以理解成一个选择器,判断“哪些新知识值得记进脑子里”。

在这里插入图片描述在这里插入图片描述在这里插入图片描述

2.3 候选隐状态

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

2.4 隐状态

在这里插入图片描述
zt越接近1,代表”记忆“下来的数据越多;而越接近0则代表”遗忘“的越多。

代码

def gru(inputs, state, params):W_xz, W_hz, b_z, W_xr, W_hr, b_r, W_xh, W_hh, b_h, W_hq, b_q = paramsH, = stateoutputs = []for X in inputs:Z = torch.sigmoid((X @ W_xz) + (H @ W_hz) + b_z)R = torch.sigmoid((X @ W_xr) + (H @ W_hr) + b_r)H_tilda = torch.tanh((X @ W_xh) + ((R * H) @ W_hh) + b_h)H = Z * H + (1 - Z) * H_tildaY = H @ W_hq + b_qoutputs.append(Y)return torch.cat(outputs, dim=0), (H,)
http://www.dtcms.com/a/470266.html

相关文章:

  • 莱州网站建设哪家好做网站要会哪些知识
  • ubuntu离线安装 xl2tpd
  • 如何在百度上做网站最好用的免费建站
  • 关联网站有那些wordpress超级排版器插件
  • 熊猫比分 APP:开启体育赛事观赛新“姿势”
  • 第二章:模块的编译与运行-9 Platform Dependency
  • java多模块概念
  • 小企业网站维护什么东西互联网培训
  • 找人做网站做的很烂网站自助建设推广
  • uhttpd HTTPS 在嵌入式与 OpenWrt 上的实战部署与排查
  • 合肥网站建设正规公司抖音如何推广引流
  • [cpprestsdk] 构建HTTP消息 | http_headers.h
  • SCI论文写作:从实验设计到发表(选题、文献调研、实验设计、数据分析、论文结构及语言规范)
  • 西安哪里有做网站的网页界面ps制作步骤
  • 《彻底理解C语言指针全攻略(2)》
  • JavaScript 性能优化实战:从原理到落地
  • 网上公司注册申请的流程江西短视频搜索seo推荐
  • 网站建设哪家好知道数字化档案馆及网站的建设
  • 汽车行业密钥灌装解决方案:构建可信的车载安全启动与通信体系
  • Vue2+Django TodoList项目跨域解决方案实战
  • 网页结构解析入门:HTML、CSS、JS 与爬虫的关系
  • Mac查看本机发出请求的IP地址
  • 《基于 YOLOv11 的武器装备视觉检测系统构建与专 利申请指南》
  • 云原生时代:微服务架构与Serverless实践指南
  • 3dgs Scene详解
  • 韩国网站设计风格网页即时聊天
  • 用 Jetpack Compose 实现仿网易云音乐播放页 + 歌词滚动
  • 既然根据时间可推算太阳矢量,为何还需要太阳敏感器?
  • 做娱乐新闻的网站有哪些网站建设教材
  • ORACLE数据库字符集