当前位置: 首页 > wzjs >正文

著名的网站有哪些广东省示范校建设专题网站

著名的网站有哪些,广东省示范校建设专题网站,网站如何备案要关站吗,做专业网站文章目录 前言一、掩蔽 Softmax 操作1.1 sequence_mask1.2 masked_softmax1.3 测试代码二、加性注意力 (Additive Attention)2.1 实现解析2.2 测试代码三、点积注意力 (Dot Product Attention)3.1 实现解析3.2 测试代码四、可视化注意力权重4.1 可视化点积注意力的权重总结前言…

文章目录

  • 前言
  • 一、掩蔽 Softmax 操作
    • 1.1 sequence_mask
    • 1.2 masked_softmax
    • 1.3 测试代码
  • 二、加性注意力 (Additive Attention)
    • 2.1 实现解析
    • 2.2 测试代码
  • 三、点积注意力 (Dot Product Attention)
    • 3.1 实现解析
    • 3.2 测试代码
  • 四、可视化注意力权重
    • 4.1 可视化点积注意力的权重
  • 总结


前言

在深度学习领域,注意力机制(Attention Mechanism)已经成为许多模型的核心组件,尤其是在自然语言处理(NLP)和计算机视觉任务中。注意力机制的核心思想是通过计算查询(Query)与键(Key)之间的相关性,动态地为值(Value)分配权重,从而聚焦于最重要的信息。本篇博客将通过 PyTorch 代码,深入探讨注意力汇聚(Attention Pooling)的两种常见评分函数:加性注意力(Additive Attention)和点积注意力(Dot Product Attention)。我们将从代码实现入手,逐步解析其原理,并通过可视化工具展示注意力权重的分布。
在这里插入图片描述

本文的目标读者是对深度学习有一定基础、希望通过代码理解注意力机制的实现细节的开发者。所有代码均基于 PyTorch,并在 Jupyter Notebook 中运行和测试。让我们开始吧!


一、掩蔽 Softmax 操作

在注意力机制中,掩蔽 Softmax(Masked Softmax)是一个关键步骤,用于确保模型只关注序列中的有效部分,避免对填充(padding)数据产生影响。我们先来看两个核心函数的实现:sequence_maskmasked_softmax

1.1 sequence_mask

sequence_mask 函数用于在序列中屏蔽不相关的项。它接收输入序列张量 X、有效长度张量 valid_len,并将无效位置替换为指定值(默认值为 0)。

import torch
import torch.nn as nndef sequence_mask(X, valid_len, value=0):"""在序列中屏蔽不相关的项参数:X: 输入序列张量,维度 [batch_size, maxlen]valid_len: 有效长度张量,维度 [batch_size]value: 填充值,标量,默认为0返回:X: 屏蔽后的序列张量,维度 [batch_size, maxlen]Defined in :numref:`sec_seq2seq_decoder`"""# 获取序列的最大长度,维度为标量maxlen = X.size(1)# 创建掩码矩阵# torch.arange(maxlen): 生成 [0, 1, ..., maxlen-1] 的序列,维度 [maxlen]# [None, :] 将其扩展为 [1, maxlen]# valid_len[:, None] 将 [batch_size] 扩展为 [batch_size, 1]# 比较结果 mask 维度为 [batch_size, maxlen]mask = torch.arange((maxlen), dtype=torch.float32,device=X.device)[None, :] < valid_len[:, None]# 使用掩码将 X 中无效位置设为 value# ~mask 为反向掩码,选择需要填充的位置X[~mask] = valuereturn X

这个函数的工作原理是:

  1. 通过 torch.arange(maxlen) 生成一个从 0 到 maxlen-1 的序列,并扩展为与批量大小匹配的形状。
  2. 使用广播机制,将 valid_len 与生成的序列比较,生成布尔掩码 mask
  3. 根据掩码,将无效位置(即超出有效长度的部分)替换为 value

1.2 masked_softmax

masked_softmax 函数在 Softmax 操作中加入掩蔽机制,确保无效位置的注意力权重为 0。

def masked_softmax(X, valid_lens):"""通过在最后一个轴上掩蔽元素来执行softmax操作参数:X: 三维张量 (batch_size, seq_len, feature_dim)valid_lens: 一维张量 (batch_size,) 或二维张量 (batch_size, seq_len),表示有效长度返回:经过masked softmax处理的张量 (batch_size, seq_len, feature_dim)"""if valid_lens is None:# 当没有指定有效长度时,直接执行标准softmaxreturn nn.functional.softmax(X, dim=-1)else:shape = X.shape  # shape: (batch_size, seq_len, feature_dim)if valid_lens.dim() == 1:# 将一维的valid_lens重复扩展到与X的第二维匹配valid_lens = torch.repeat_interleave(valid_lens, shape[1])else:# 将二维的valid_lens展平为一维valid_lens = valid_lens.reshape(-1)# 在最后一轴上对被掩蔽的元素使用非常大的负值替换,使其softmax输出为0X = sequence_mask(X.reshape(-1, shape[-1]), valid_lens,value=-1e6)# 执

文章转载自:

http://gVewjaRR.qzpsk.cn
http://01R2hM0r.qzpsk.cn
http://KDJ3IAxV.qzpsk.cn
http://l4v5UpvU.qzpsk.cn
http://RVe5nAoz.qzpsk.cn
http://O3d1P9Cf.qzpsk.cn
http://7ddwiKOk.qzpsk.cn
http://On9vtoZR.qzpsk.cn
http://QGIknw9D.qzpsk.cn
http://i9GLk5iS.qzpsk.cn
http://5YHLipvc.qzpsk.cn
http://wDQnOz3V.qzpsk.cn
http://5pYthCC3.qzpsk.cn
http://BywdIUrG.qzpsk.cn
http://Yz3XqaHt.qzpsk.cn
http://jjZepEHl.qzpsk.cn
http://eUQAz2Rl.qzpsk.cn
http://QyKi4ohT.qzpsk.cn
http://lgG67f9q.qzpsk.cn
http://e7ekIM8z.qzpsk.cn
http://ruJXA1Tv.qzpsk.cn
http://kh3P3ujZ.qzpsk.cn
http://ad41LU0m.qzpsk.cn
http://O6759Ja7.qzpsk.cn
http://P0pYA0KP.qzpsk.cn
http://SQwQfSaR.qzpsk.cn
http://KZZFNj2X.qzpsk.cn
http://QJbbgR07.qzpsk.cn
http://WP9jeYct.qzpsk.cn
http://9ZKWpcz3.qzpsk.cn
http://www.dtcms.com/wzjs/742737.html

相关文章:

  • 网站备案找哪个部门国内国际时事100字
  • 泉州做网站优化新手怎么优化网站
  • 网站关键词库怎么做有什么效果襄阳路桥建设集团有限公司网站
  • 网站建设所需的硬件设备甘肃网站seo技术厂家
  • 韶关市网站建设公司浙江平台网站建设找哪家
  • 苏州网站设计电话好网站的标准
  • wordpress网站示例怎样设计网站主页
  • 网站项目建设方案文档网站前端设计外包公司
  • 织梦 网站统计网站地图怎么生成
  • 做网站后的收获wordpress前缀有哪些
  • 网站品牌形象设计怎么做钉钉企业注册流程
  • 秦皇岛网站制作方案杭州淘策网站开发
  • 爱网站关键词挖掘网站的图片要会员才能下载怎么做
  • 邵阳建设网站wordpress赞踩插件
  • 做网站是怎么挣钱的全国十大广告公司
  • 短信验证码接码网站建设上海政务网站建设
  • 建筑工人app电商网站怎样做优化才最合理
  • 网站seo课设返利导购网站建设需求文档
  • 网站建设热门吗正规手机网站怎么做
  • 网络服务商网站百度站长之家
  • 东莞北京网站建设价格wordpress登陆错误500
  • 网站域名建设费进什么科目秋林 做网站
  • 扬州网站建设哪家好中信银行官网
  • 网络营销网站推广wordpress怎么建立网站吗
  • 官网百度苏州seo优化公司
  • 国外空间设计网站wordpress ip设置
  • 为网站做外链的文章中科院网站建设
  • 揭阳模板网站建站协达网站建设
  • .net是建网站的吗国外服务器购买
  • WordPress仿站助手seo百科大全