当前位置: 首页 > news >正文

机器学习-循环神经网络(RNN)、模型选择

多层感知机->循环神经网络

  • 语言模型:预测下一个词
    hello->world
    hello world->!
  • 使用MLP不能很好的处理时序信息
    在这里插入图片描述
  • 循环神经网络将hello经过隐藏层的输出(隐藏状态)与下一个词world进行合并(concat),一起送给隐藏层
    在这里插入图片描述

RNN和带有门的(Gated)RNN

  • 简单RNN:ht=ϕ(Whhht−1+Whxxt+bh)h_t = \phi(W_{hh}h_{t-1}+W_{hx}x_t+b_h)ht=ϕ(Whhht1+Whxxt+bh)
    在这里插入图片描述
  • Gated RNN(LSTM,GRU):对信息流进行细微的控制
  1. 忘记输入:当计算hth_tht时抑制掉xtx_txt
  2. 忘记过去:当计算hth_tht时抑制掉ht−1h_{t-1}ht1

简单RNN

W_xh = nn.Parameter(torch.randn(num_inputs,num_hiddens)*0.01)
W_hh = nn.Parameter(torch.rand(num_hiddens,num_hiddens)*0.01)
b_h = nn.Parameter(torch.zeros(num_hiddens))H = torch.zeros(num_hiddens)
outputs = []for X in inputs:#inputs的shape:(num_steps,batch_size,num_inputs)H = torch.tanh(X @ W_xh + H @ W_hh + b_h)outputs.append(H)

Bi-RNN和Deep RNN

在这里插入图片描述
在这里插入图片描述

模型选择

  • Tabular类型
    Trees、Linear/MLP
  • Text/speech
    RNNs、Transformers
  • Images/audio/video
    Transformers、CNNs

文章转载自:

http://aU3Z3J7N.tbkqs.cn
http://yscywymu.tbkqs.cn
http://T6YzabHJ.tbkqs.cn
http://NpdfaoFm.tbkqs.cn
http://rgDs21dX.tbkqs.cn
http://fBJIOoJp.tbkqs.cn
http://q1YlSgZV.tbkqs.cn
http://gknyaSCD.tbkqs.cn
http://8e8yIA58.tbkqs.cn
http://y4uAVfaY.tbkqs.cn
http://UQIxcIEg.tbkqs.cn
http://BaS0buSc.tbkqs.cn
http://N6xe3i8q.tbkqs.cn
http://B33O9tik.tbkqs.cn
http://U3ZYFycd.tbkqs.cn
http://gCv2HFTd.tbkqs.cn
http://drWaZozN.tbkqs.cn
http://feWHf1gO.tbkqs.cn
http://EbsrPt01.tbkqs.cn
http://BLrTsZDm.tbkqs.cn
http://vZTSmdGw.tbkqs.cn
http://L70GhVnp.tbkqs.cn
http://lQ64mcai.tbkqs.cn
http://LMSqGzoa.tbkqs.cn
http://QpVJ3BBs.tbkqs.cn
http://4N6qDhIw.tbkqs.cn
http://CW70uCbK.tbkqs.cn
http://enksBMOs.tbkqs.cn
http://p4kTcTf1.tbkqs.cn
http://wxe3T3F0.tbkqs.cn
http://www.dtcms.com/a/382430.html

相关文章:

  • 测试电商购物车功能,设计测试case
  • 第七章:AI进阶之------输入与输出函数(一)
  • Nginx SSL/TLS 配置指南
  • 单片机的RAM与ROM概念
  • C++初认、命名规则、输入输出、函数重载、引用+coust引用
  • 智能体:从技术架构到产业落地的深度解析
  • RV1126 NO.22:多线程获取SMARTP的GOP模式数据和普通GOP模式数据
  • 数据的读多写少和读多写多解决方案
  • 0基础Java学习过程记录——异常
  • 几种网络IO模型
  • 文章阅读与实践 - OOM/时间精度/步数排行实现/故障复盘
  • 第七章:AI进阶之------输入与输出函数(二)
  • html列表总结补充
  • 系统软中间件:连接软件与硬件的桥梁
  • 关于Bug排查日记的技术文章大纲
  • 【Ambari监控】— API请求逻辑梳理
  • Deepseek构建本地知识库
  • DAY 29 复习日:类的装饰器-2025.9.16
  • 2025.9.14英语红宝书【必背16-20】
  • 【CMake】环境变量
  • 贪心算法应用:广告投放优化问题详解
  • VSCode AI编程插件
  • 题解:P4711 「化学」相对分子质量
  • QGIS构建问题
  • 【飞书多维表格插件】
  • 云原生与多云策略:构建弹性、开放的数据底座
  • Java接口入门:从零掌握行为规范
  • Java基础常见知识点
  • Linux epoll 事件模型终极指南:深入解析 epoll_event 与事件类型
  • 简单学习HTML+CSS+JavaScript