当前位置：首页 > news >正文

NLP：初识RNN模型（概念、分类、作用）

news 2025/7/10 10:42:46

本文目录：

一、RNN相关概念
二、RNN模型的基本运作
三、RNN的分类
- （一）根据输入和输出的结构分类
- - 1. N vs N - RNN
  - 2. N vs 1 - RNN
  - 3. 1 vs N - RNN
  - 4. N vs M - RNN
- （二）根据RNN的内部构造分类
- - 1.传统RNN ：简单时间序列预测（如股票价格短期趋势）。
  - 2.LSTM 长短期记忆网络）：机器翻译、语音识别（需长程依赖的任务）。
  - 3. Bi-LSTM（双向LSTM）：命名实体识别（NER）、情感分析。
  - 4. GRU （门控循环单元）：文本生成、视频帧预测。
  - 5. Bi-GRU（双向GRU）：实时性要求较高的任务（如在线评论情感分析）。
附赠1：（N vs N、 N vs 1、 1 vs N 、N vs M ）RNN对比
附赠2：（传统RNN 、 LSTM 、 Bi-LSTM 、 GRU 、 Bi-GRU）RNN对比

前言：前面几篇文章讲解了NLP数据的基本处理，从这篇文章开始做NLP相关模型的普及。。。

首先普及RNN模型。

一、RNN相关概念

RNN(Recurrent Neural Network), 中文称作循环神经网络, 它一般以序列数据（即数值与所在位置均包含重要信息的数据，如时间序列、文本、语音等）为输入, 通过网络内部的结构设计有效捕捉序列之间的关系特征, 一般也是以序列形式进行输出。

其核心特点是具有记忆能力，能够利用前一时刻的隐藏状态影响当前时刻的输出，从而捕捉序列中的动态信息。

一般单层神经网络结构:
在这里插入图片描述

RNN单层网络结构:

在这里插入图片描述
以时间步对RNN进行展开后的单层网络结构:

RNN的优缺点：

在这里插入图片描述

二、RNN模型的基本运作

RNN常用于NLP的文本分类、情感分析、意图识别等任务。

下面我们将以一个用户意图识别的例子进行简单的分析:
在这里插入图片描述
第一步: 用户输入了"What time is it ?", 我们首先对它进行基本的分词, 因为RNN是按照顺序工作的, 每次只接收一个单词进行处理。

第二步: 首先将单词"What"输送给RNN, 它将产生一个隐层输出O1。

第三步: 继续将单词"time"输送给RNN, 但此时RNN不仅仅利用"time"来产生输出O2, 还会使用来自上一层隐层输出O1作为输入信息。

在这里插入图片描述

第四步: 重复这样的步骤, 直到处理完所有的单词。

在这里插入图片描述
第五步: 最后，将隐层输出O5经过处理来解析用户意图。

三、RNN的分类

这里我们将从两个角度对RNN模型进行分类. 第一个角度是输入和输出的结构, 第二个角度是RNN的内部构造。

（一）根据输入和输出的结构分类

1. N vs N - RNN

在这里插入图片描述

在这里插入图片描述

2. N vs 1 - RNN

在这里插入图片描述

在这里插入图片描述

3. 1 vs N - RNN

在这里插入图片描述

4. N vs M - RNN

在这里插入图片描述

（二）根据RNN的内部构造分类

1.传统RNN ：简单时间序列预测（如股票价格短期趋势）。

在这里插入图片描述

2.LSTM 长短期记忆网络）：机器翻译、语音识别（需长程依赖的任务）。

在这里插入图片描述

3. Bi-LSTM（双向LSTM）：命名实体识别（NER）、情感分析。

在这里插入图片描述

4. GRU （门控循环单元）：文本生成、视频帧预测。

在这里插入图片描述

5. Bi-GRU（双向GRU）：实时性要求较高的任务（如在线评论情感分析）。

在这里插入图片描述

重点是传统RNN、LSTM和GRU。

文章的最后~

附赠1：（N vs N、 N vs 1、 1 vs N 、N vs M ）RNN对比

在这里插入图片描述

附赠2：（传统RNN 、 LSTM 、 Bi-LSTM 、 GRU 、 Bi-GRU）RNN对比

在这里插入图片描述

今天的分享到此结束。

http://www.dtcms.com/a/270750.html

相关文章：

HarmonyOS应用开发者高级试题2025年7月部分单选题

【深度学习】【入门】Sequential的使用和简单神经网络搭建

Selenium+Pytest自动化测试框架实战前言#

使用LLaMA-Factory微调Qwen2.5-VL-3B 的目标检测任务-数据集格式转换（voc 转 ShareGPT）

Mac mini 高性价比扩容 + Crossover 游戏实测全流程手册

SpringCloud系列 - Seata 分布式事务（六）

AJAX 学习

如何将华为手机中的照片传输到电脑

Django核心知识点详解：JSON、AJAX、Cookie、Session与用户认证

【Kafka】登录日志处理的三次阶梯式优化实践：从同步写入到Kafka多分区批处理

2311. 小于等于 K 的最长二进制子序列— day98

数字大脑的培育法则：深度解读监督学习神经网络

（C++）任务管理系统（正式版）(迭代器)（list列表基础教程）（STL基础知识）

【Gin】HTTP 请求调试器

C/C++ 高频八股文面试题1000题(二)

Java中Map、List 和 Set 之间的常见转换方法总结

vcpkg交叉编译qt等过程记录（未完成）

HarmonyOS应用开发者高级试题2025年7月部分单选题（带答案）

学习日记-spring-day44-7.9

C++随机打乱函数：简化源码与原理深度剖析

leetcode11.盛最多水的容器

Webpack、Vite配置技巧与CI/CD流程搭建全解析

【RTSP从零实践】9、多播传输AAC格式的RTP包(附带源码)

mac m1安装大模型工具vllm

kotlin学习，val使用get()的问题

mysql 安装实战

Claude Code 开发使用技巧

User手机上如何抓取界面的布局uiautomatorviewer

Linux的`if test`和`if [ ]中括号`的取反语法比较笔记250709

Unity Demo-3DFarm详解-其二