当前位置: 首页 > news >正文

NLP:初识RNN模型(概念、分类、作用)

本文目录:

  • 一、RNN相关概念
  • 二、RNN模型的基本运作
  • 三、RNN的分类
    • (一)根据输入和输出的结构分类
      • 1. N vs N - RNN
      • 2. N vs 1 - RNN
      • 3. 1 vs N - RNN
      • 4. N vs M - RNN
    • (二)根据RNN的内部构造分类
      • 1.传统RNN :简单时间序列预测(如股票价格短期趋势)。
      • 2.LSTM 长短期记忆网络):机器翻译、语音识别(需长程依赖的任务)。
      • 3. Bi-LSTM(双向LSTM) :命名实体识别(NER)、情感分析。
      • 4. GRU (门控循环单元):文本生成、视频帧预测。
      • 5. Bi-GRU(双向GRU):实时性要求较高的任务(如在线评论情感分析)。
  • 附赠1:(N vs N、 N vs 1、 1 vs N 、N vs M )RNN对比
  • 附赠2:(传统RNN 、 LSTM 、 Bi-LSTM 、 GRU 、 Bi-GRU)RNN对比

前言:前面几篇文章讲解了NLP数据的基本处理,从这篇文章开始做NLP相关模型的普及。。。

首先普及RNN模型

一、RNN相关概念

RNN(Recurrent Neural Network), 中文称作循环神经网络, 它一般以序列数据(即数值与所在位置均包含重要信息的数据,如时间序列、文本、语音等)为输入, 通过网络内部的结构设计有效捕捉序列之间的关系特征, 一般也是以序列形式进行输出。

其核心特点是具有记忆能力,能够利用前一时刻的隐藏状态影响当前时刻的输出,从而捕捉序列中的动态信息。

一般单层神经网络结构:
在这里插入图片描述

RNN单层网络结构:

在这里插入图片描述
以时间步对RNN进行展开后的单层网络结构:
在这里插入图片描述

RNN的优缺点:

在这里插入图片描述

二、RNN模型的基本运作

RNN常用于NLP的文本分类、情感分析、 意图识别等任务。

下面我们将以一个用户意图识别的例子进行简单的分析:
在这里插入图片描述
第一步: 用户输入了"What time is it ?", 我们首先对它进行基本的分词, 因为RNN是按照顺序工作的, 每次只接收一个单词进行处理。
在这里插入图片描述
第二步: 首先将单词"What"输送给RNN, 它将产生一个隐层输出O1。
在这里插入图片描述

第三步: 继续将单词"time"输送给RNN, 但此时RNN不仅仅利用"time"来产生输出O2, 还会使用来自上一层隐层输出O1作为输入信息。

在这里插入图片描述

第四步: 重复这样的步骤, 直到处理完所有的单词。

在这里插入图片描述
第五步: 最后,将隐层输出O5经过处理来解析用户意图。
在这里插入图片描述

三、RNN的分类

这里我们将从两个角度对RNN模型进行分类. 第一个角度是输入和输出的结构, 第二个角度是RNN的内部构造。

(一)根据输入和输出的结构分类

1. N vs N - RNN

在这里插入图片描述

在这里插入图片描述

2. N vs 1 - RNN

在这里插入图片描述

在这里插入图片描述

3. 1 vs N - RNN

在这里插入图片描述
在这里插入图片描述

4. N vs M - RNN

在这里插入图片描述
在这里插入图片描述

(二)根据RNN的内部构造分类

1.传统RNN :简单时间序列预测(如股票价格短期趋势)。

在这里插入图片描述

2.LSTM 长短期记忆网络):机器翻译、语音识别(需长程依赖的任务)。

在这里插入图片描述

3. Bi-LSTM(双向LSTM) :命名实体识别(NER)、情感分析。

在这里插入图片描述

4. GRU (门控循环单元):文本生成、视频帧预测。

在这里插入图片描述

5. Bi-GRU(双向GRU):实时性要求较高的任务(如在线评论情感分析)。

在这里插入图片描述

重点是传统RNN、LSTM和GRU。

文章的最后~

附赠1:(N vs N、 N vs 1、 1 vs N 、N vs M )RNN对比

在这里插入图片描述

附赠2:(传统RNN 、 LSTM 、 Bi-LSTM 、 GRU 、 Bi-GRU)RNN对比

在这里插入图片描述

今天的分享到此结束。

http://www.dtcms.com/a/270750.html

相关文章:

  • HarmonyOS应用开发者高级试题2025年7月部分单选题
  • 【深度学习】【入门】Sequential的使用和简单神经网络搭建
  • Selenium+Pytest自动化测试框架实战前言#
  • 使用LLaMA-Factory微调Qwen2.5-VL-3B 的目标检测任务-数据集格式转换(voc 转 ShareGPT)
  • Mac mini 高性价比扩容 + Crossover 游戏实测 全流程手册
  • SpringCloud系列 - Seata 分布式事务(六)
  • AJAX 学习
  • 如何将华为手机中的照片传输到电脑
  • Django核心知识点详解:JSON、AJAX、Cookie、Session与用户认证
  • 【Kafka】登录日志处理的三次阶梯式优化实践:从同步写入到Kafka多分区批处理
  • 2311. 小于等于 K 的最长二进制子序列— day98
  • 数字大脑的培育法则:深度解读监督学习神经网络
  • (C++)任务管理系统(正式版)(迭代器)(list列表基础教程)(STL基础知识)
  • 【Gin】HTTP 请求调试器
  • C/C++ 高频八股文面试题1000题(二)
  • Java中Map、List 和 Set 之间的常见转换方法总结
  • vcpkg交叉编译qt等过程记录(未完成)
  • HarmonyOS应用开发者高级试题2025年7月部分单选题(带答案)
  • 学习日记-spring-day44-7.9
  • C++随机打乱函数:简化源码与原理深度剖析
  • leetcode11.盛最多水的容器
  • Webpack、Vite配置技巧与CI/CD流程搭建全解析
  • 【RTSP从零实践】9、多播传输AAC格式的RTP包(附带源码)
  • mac m1安装大模型工具vllm
  • kotlin学习,val使用get()的问题
  • mysql 安装实战
  • Claude Code 开发使用技巧
  • User手机上如何抓取界面的布局uiautomatorviewer
  • Linux的`if test`和`if [ ]中括号`的取反语法比较 笔记250709
  • Unity Demo-3DFarm详解-其二