NLP:初识RNN模型(概念、分类、作用)
本文目录:
- 一、RNN相关概念
- 二、RNN模型的基本运作
- 三、RNN的分类
- (一)根据输入和输出的结构分类
- 1. N vs N - RNN
- 2. N vs 1 - RNN
- 3. 1 vs N - RNN
- 4. N vs M - RNN
- (二)根据RNN的内部构造分类
- 1.传统RNN :简单时间序列预测(如股票价格短期趋势)。
- 2.LSTM 长短期记忆网络):机器翻译、语音识别(需长程依赖的任务)。
- 3. Bi-LSTM(双向LSTM) :命名实体识别(NER)、情感分析。
- 4. GRU (门控循环单元):文本生成、视频帧预测。
- 5. Bi-GRU(双向GRU):实时性要求较高的任务(如在线评论情感分析)。
- 附赠1:(N vs N、 N vs 1、 1 vs N 、N vs M )RNN对比
- 附赠2:(传统RNN 、 LSTM 、 Bi-LSTM 、 GRU 、 Bi-GRU)RNN对比
前言:前面几篇文章讲解了NLP数据的基本处理,从这篇文章开始做NLP相关模型的普及。。。
首先普及RNN模型。
一、RNN相关概念
RNN(Recurrent Neural Network), 中文称作循环神经网络, 它一般以序列数据(即数值与所在位置均包含重要信息的数据,如时间序列、文本、语音等)为输入, 通过网络内部的结构设计有效捕捉序列之间的关系特征, 一般也是以序列形式进行输出。
其核心特点是具有记忆能力,能够利用前一时刻的隐藏状态影响当前时刻的输出,从而捕捉序列中的动态信息。
一般单层神经网络结构:
RNN单层网络结构:
以时间步对RNN进行展开后的单层网络结构:
RNN的优缺点:
二、RNN模型的基本运作
RNN常用于NLP的文本分类、情感分析、 意图识别等任务。
下面我们将以一个用户意图识别的例子进行简单的分析:
第一步: 用户输入了"What time is it ?", 我们首先对它进行基本的分词, 因为RNN是按照顺序工作的, 每次只接收一个单词进行处理。
第二步: 首先将单词"What"输送给RNN, 它将产生一个隐层输出O1。
第三步: 继续将单词"time"输送给RNN, 但此时RNN不仅仅利用"time"来产生输出O2, 还会使用来自上一层隐层输出O1作为输入信息。
第四步: 重复这样的步骤, 直到处理完所有的单词。
第五步: 最后,将隐层输出O5经过处理来解析用户意图。
三、RNN的分类
这里我们将从两个角度对RNN模型进行分类. 第一个角度是输入和输出的结构, 第二个角度是RNN的内部构造。
(一)根据输入和输出的结构分类
1. N vs N - RNN
2. N vs 1 - RNN
3. 1 vs N - RNN
4. N vs M - RNN
(二)根据RNN的内部构造分类
1.传统RNN :简单时间序列预测(如股票价格短期趋势)。
2.LSTM 长短期记忆网络):机器翻译、语音识别(需长程依赖的任务)。
3. Bi-LSTM(双向LSTM) :命名实体识别(NER)、情感分析。
4. GRU (门控循环单元):文本生成、视频帧预测。
5. Bi-GRU(双向GRU):实时性要求较高的任务(如在线评论情感分析)。
重点是传统RNN、LSTM和GRU。
文章的最后~
附赠1:(N vs N、 N vs 1、 1 vs N 、N vs M )RNN对比
附赠2:(传统RNN 、 LSTM 、 Bi-LSTM 、 GRU 、 Bi-GRU)RNN对比
今天的分享到此结束。