当前位置：首页 > news >正文

nlp进阶

news 2025/10/11 5:50:47

1 Rnn

RNN(Recurrent Neural Network),中文称作循环神经网络,它一般以序列数据为输入,通过网络内部的结构段计有效捕捉序列之间的关系特征,一般也是以序列形式进行输出.

单层网络结构在循环

rnn处理的过程

rnn类别

n - n

n - 1 使用sigmoid 或者softmax处理应用在分类中

1- n x作用于每一个输入图片生成文字

n - M

2传统rnn

内部结构

优缺点 :

计算资源的要求低,短序列表现优异.

缺点长序列的关联时表现很差,在反向传播时候梯度消失或者爆炸

2 lstm

能够有效捕捉长序列之间的语义关联,缓解梯度消失或爆炸现象.同时LSTM的结构更复杂,它的核心结构可以分为四个部分去解析: 输入门遗忘门输出们细胞状态 .

遗忘门代表遗忘过去的多少信息sigmiod
忘记长一层的多少信息

2.1 BI -LSTM

import torch.nn as nn
import torch


lstm = nn.LSTM(input_size=6, hidden_size=8, num_layers=2)
                输入的词数量  每次处理样本的数量  维度
input = torch.randn(2,3,6)
      #           层数  处理样本数   维度
h0 = torch.randn(2,3,8)
c0 = torch.randn(2,3,8)

output,(h1,c1) = lstm(input,(h0,c0))
print(output,h1,c1)

input 和 h0 的批量大小（batch_size）必须相同。

3GRU 门控循环单元

GRU(Gated Recurrent Unit)也称门控循环单元结构,它也是传统RNN的变体,

优点: 同LSTM一样能够有效捕捉长序列之间的语义关联,缓解梯度消失或爆炸现象,同时它的结构和计算要比LSTM更简单,它的核心结构可以分为两个部分去解析:
。更新门z
。重置门 r

缺点 : 与rnn相同不能并行计算

import torch.nn as nn 
import torch
gru = nn.GRU(5,8,1)
input = torch.randn(2,5,5)
h1= torch.randn(1,5,8)
output,h0 = gru(input,h1)

4注意力机制

注意力:在判断一个问题时,我们直接将注意力去放在具有辨识度的部分上面进行判断,不是全部都看一遍.

注意力机制:指的是用注意力计算规则应用于深度学习网络载体.

在nlp种注意力机制大多应用与seq2seq(编码器解码器模型)

q k v 计算的三步

query 和 key 进行相似度计算，得到一个query 和 key 相关性的分值将

这个分值进行归一化(softmax)，得到一个注意力的分布使用注意力分布

value 进行计算，得到一个融合注意力的更好的 value 值

查看全文

http://www.dtcms.com/a/56039.html

200个前卫街头氛围涂鸦艺术水墨颜料手绘笔迹飞溅PNG免扣迭加纹理素材 VANTABLACK TEXTURES

C语言文件操作相关函数详解：fread、fwrite、fseek、ftell、fclose

华为OD机试-最长的密码（Java 2024 E卷 100分）

3.6 登录认证

vtkDepthSortPolyData 根据相机视图方向对多边形数据进行排序

2025政府工作报告亮点：发展新质生产力，为现代化产业体系 “赋能提速”！

leetcode日记（84）交错字符串

基于STM32的简易出租车计费设计(Proteus仿真+程序+设计报告+原理图PCB+讲解视频）

计算机组成原理笔记(一)——1.1电子计算机与存储程序控制

flask-定时任务

AMBA 总线及AXI协议介绍

【计网】运输层

【PSIM】峰值电流如何用D类触发器

浅说图论基础

数据库【MySQL安装配置篇（保姆级教程）】

【go】以Kubernetes中的 kubelet 为引思考go语言中共享状态的选择

LeetCode 解题思路 12（Hot 100）

使用ffmpeg读取mp4文件解码失败

如何记录日常笔记

Django 中的算法应用与实现

LeetCode - 神经网络的反向传播(Sigmoid + MSE) 教程

玩转python: 掌握Python数据结构之链表

安当全栈式金仓数据库安全解决方案：透明加密、动态凭据与勒索防护一体化实践

【免费】2000.1-2021.9上市公司仲裁数据

TypeError: Cannot set properties of undefined (setting ‘xxx‘)

c++快速入门-2

计算机网络-服务器模型

labelimg标注的xml标签转换为yolo格式标签

TMS320F28P550SJ9学习笔记4：导入其余包文件

若依ry-vue分离板（完整版）前后端部署