当前位置：首页 > news >正文

注意力机制-10.1.3注意力可视化

news 2025/10/14 8:14:23

平均汇聚层可以被视为输入的加权平均值，其中各输入的权重是一样的，实际上，注意力汇聚得到的是加权平均的总和，其中权重是在给定的查询和不同的键之间计算得出的。

import torch

from d2l import torch as d2l

为了可视化注意力权重，需要定一个show_heatmaps函数，且输入matrices的形状是（要现实的行数，要现实的列数，查询数，键数）

def show_heatmaps(matrics, xlabel, ylabel, titles=None, figsize=(2.5, 2.5), cmap='Reds'):

#显示矩阵热图

d2l.use_svg_display()

num_rows, num_cols = matrics.shape[0], matrices.shape[1]

fig, axes = d2l.plt.subplots(nnum_rows, num_cols, figsize=figsize, sharex=True, sharey=True, squeeze=False)

for i, (row_axes, row_matrices) in enumerate(zip(axes, matrices)):

for j, (ax, matrix) in enumerate(zip(row_axesm row_matrices)):

pcm = ax.imshow(matrix,detach().numpy(), cmap=cmap)

if i == num_rows - 1:

ax.set_xlabel(xlabel)

if j == 0:

ax.set_ylabel(ylabel)

if titles:

ax.set_title(titles[j])

fig.colorbar(pcm, ax=axes, shrink=0.6):

下面使用一个简单的例子进行演示，在本例中，仅当查询和键相同时，注意力权重为1，否则为0.

attention_weights = torch.eye(10).reshape(1, 1, 10, 10)

show_heatmaps(attention_weights, xlabel='keys', ylabel='Queries')

后面的章节将经常调用show_heatmaps函数来显示注意力权重

小结：

人类的注意力是有限的，有价值的和稀缺的资源

受试者使用非自主性和自主性提示有选择地引导注意力，前者基于突出性，后者则依赖意识。

注意力机制与全连接层或者汇聚层区别源于增加的自主性展示

由于包含自主性提示，注意力机制与全连接层或汇聚层不同。

注意力机制通过注意力汇聚使得选择偏向于值，其中包含查询和键，键和值是成对的。

可视化查询和键之间的注意力权重是可行的。

查看全文

http://www.dtcms.com/a/478159.html

网站维护公司苏州网站推广优化

Codeforces Educational 183（ABCD）

为什么建设网站要年年交钱石家庄最新今天消息

2025年语音识别（ASR）与语音合成（TTS）技术趋势分析对比

TortoiseSVN-1.8.10.26129-x64-svn-1.8.11.msi

鸿蒙NEXT应用接入快捷栏：一键直达，提升用户体验

前端接EXCEL

深圳企业网站建设推荐公司网站开发的方法

网站建设价格wordpress管理员改为投稿者

2025程序综合实践第三次DFS2

记录一次前端文件缓存问题

深度预测调和网络(DFRN)医疗应用编程路径分析

bkhtmltopdf - 高性能 HTML 转 PDF 工具（代替 wkhtmltopdf）

OpenCV基础入门2

数据结构——二叉树的从前序与中序遍历序列构造二叉树

做网站要用到的技术网站维护主要做哪些

聚焦string：C++ string 核心接口、编译器差异与自定义实现的深度剖析

【Java集合体系】全面解析：架构、原理与实战选型

999免费的网站北京网站设计方案

复制和粘贴快捷键ctrl加什么？【图文详解】电脑复制粘贴快捷键？剪贴板历史记录？电脑快捷键大全？快捷键操作？

手机网站样式专门做婚庆的网站

知识付费产品：如何与用户建立长期价值共生关系？

操作【GM3568JHF】FPGA+ARM异构开发板使用指南：音频接口

Redis -持久化

[css]基础知识和常见应用

电子商务网站的建设费用案例涿州网站建设

企业网站推广哪家公司好惠州网站建设方案外包

容器管理不再受限！PortainerCE+cpolar打造云端数字指挥中心

无人机抗电磁干扰机理与抗干扰技术研究综述

Spring Batch 容错机制分析

相关文章：