当前位置: 首页 > news >正文

注意力机制-10.1.3注意力可视化

平均汇聚可以视为输入加权平均值其中输入的权重是一样实际上注意力汇聚得到加权平均总和其中权重是在给定查询和不同之间计算得出

import torch

from d2l import torch as d2l

为了可视化注意力权重需要一个show_heatmaps函数输入matrices形状(要现实的行数,要现实的列数,查询数,键数)

def show_heatmaps(matrics, xlabel, ylabel, titles=None, figsize=(2.5, 2.5), cmap='Reds'):

#显示矩阵

d2l.use_svg_display()

num_rows, num_cols = matrics.shape[0], matrices.shape[1]

fig, axes = d2l.plt.subplots(nnum_rows, num_cols, figsize=figsize, sharex=True, sharey=True, squeeze=False)

for i, (row_axes, row_matrices) in enumerate(zip(axes, matrices)):

for j, (ax, matrix) in enumerate(zip(row_axesm row_matrices)):

pcm = ax.imshow(matrix,detach().numpy(), cmap=cmap)

if i == num_rows - 1:

ax.set_xlabel(xlabel)

if j == 0:

ax.set_ylabel(ylabel)

if titles:

ax.set_title(titles[j])

fig.colorbar(pcm, ax=axes, shrink=0.6):

下面使用一个简单的例子进行演示,在本例中,仅当查询和键相同时,注意力权重为1,否则为0.

attention_weights = torch.eye(10).reshape(1, 1, 10, 10)

show_heatmaps(attention_weights, xlabel='keys', ylabel='Queries')

后面的章节将经常调用show_heatmaps函数来显示注意力权重

小结:

人类的注意力是有限的,有价值的和稀缺的资源

受试者使用非自主性和自主性提示有选择地引导注意力,前者基于突出性,后者则依赖意识。

注意力机制与全连接层或者汇聚层区别源于增加的自主性展示

由于包含自主性提示,注意力机制与全连接层或汇聚层不同。

注意力机制通过注意力汇聚使得选择偏向于值,其中包含查询和键,键和值是成对的。

可视化查询和键之间的注意力权重是可行的。

http://www.dtcms.com/a/478159.html

相关文章:

  • 网站维护公司苏州网站推广优化
  • Codeforces Educational 183(ABCD)
  • 为什么建设网站要年年交钱石家庄最新今天消息
  • 2025年语音识别(ASR)与语音合成(TTS)技术趋势分析对比
  • TortoiseSVN-1.8.10.26129-x64-svn-1.8.11.msi
  • 鸿蒙NEXT应用接入快捷栏:一键直达,提升用户体验
  • 前端接EXCEL
  • 深圳企业网站建设推荐公司网站开发的方法
  • 网站建设 价格wordpress管理员改为投稿者
  • 2025程序综合实践第三次DFS2
  • 记录一次前端文件缓存问题
  • 深度预测调和网络(DFRN)医疗应用编程路径分析
  • bkhtmltopdf - 高性能 HTML 转 PDF 工具(代替 wkhtmltopdf)
  • OpenCV基础入门2
  • 数据结构——二叉树的从前序与中序遍历序列构造二叉树
  • 做网站要用到的技术网站维护主要做哪些
  • 聚焦string:C++ string 核心接口、编译器差异与自定义实现的深度剖析
  • 【Java集合体系】全面解析:架构、原理与实战选型
  • 999免费的网站北京网站设计方案
  • 复制和粘贴快捷键ctrl加什么?【图文详解】电脑复制粘贴快捷键?剪贴板历史记录?电脑快捷键大全?快捷键操作?
  • 手机网站样式专门做婚庆的网站
  • 知识付费产品:如何与用户建立长期价值共生关系?
  • 操作【GM3568JHF】FPGA+ARM异构开发板 使用指南:音频接口
  • Redis -持久化
  • [css]基础知识和常见应用
  • 电子商务网站的建设费用案例涿州网站建设
  • 企业网站推广哪家公司好惠州网站建设方案外包
  • 容器管理不再受限!PortainerCE+cpolar打造云端数字指挥中心
  • 无人机抗电磁干扰机理与抗干扰技术研究综述
  • Spring Batch 容错机制分析