当前位置：首页 > wzjs >正文

怎么做引流网站现在最火的推广平台有哪些

wzjs 2025/9/9 16:29:02

怎么做引流网站,现在最火的推广平台有哪些,苏州晶体公司网站,宁波慈溪网站建设注意力机制心理学动物需要在复杂的环境下有效关注值得注意的点心理学框架：人类根据随意线索和不随意线索选择注意点红色杯子：不随意线索（红色的杯子比较的显著，不需要额外的想法，自然而然会去看这个&#xff09…

注意力机制

心理学

动物需要在复杂的环境下有效关注值得注意的点
心理学框架：人类根据随意线索和不随意线索选择注意点
在这里插入图片描述
红色杯子：不随意线索（红色的杯子比较的显著，不需要额外的想法，自然而然会去看这个）

想读书：随意线索

注意力机制

卷积、全连接、池化层都只考虑不随意线索
注意力机制则显示的考虑随意线索

随意线索被称之为查询（query）
每个输入是一个值（value）和不随意线索（key）的对
通过注意力池化层来有偏向性的选择某些输入

在这里插入图片描述

非参注意力池化层

给定数据 $x_i, y_i), i = 1,...,n$
平均池化是最简单的方案： $\frac{1}{n} \sum_{i} y_i$
更好的方案是 60 年代提出来的 Nadaraya-Watson 核回归

$\sum_{i=1}^{n} \frac{K(x - x_i)}{\sum_{j=1}^{n} K(x - x_j)} y_i$
在这里插入图片描述

Nadaraya-Watson核回归

使用高斯核 $\frac{1}{\sqrt{2\pi}} \exp(-\frac{u^2}{2})$
那么 $\sum_{i=1}^{n} \frac{\exp \left( -\frac{1}{2}(x - x_i)^2 \right)}{\sum_{j=1}^{n} \exp \left( -\frac{1}{2}(x - x_j)^2 \right)} y_i$
$\sum_{i=1}^{n} \text{softmax} \left( -\frac{1}{2}(x - x_i)^2 \right) y_i$

参数化的注意力机制

在之前基础上引入可以学习的 $w$
$\sum_{i=1}^{n} \text{softmax} \left( -\frac{1}{2}((x - x_i)w)^2 \right) y_i$

总结

心理学认为人通过随意线索和不随意线索选择注意点
注意力机制中，通过query（随意线索）和key（不随意线索）来有偏向性的选择输入
- 可以一般的写作 $\sum_{i} \alpha(x, x_i) y_i$ ，这里 $\alpha(x, x_i)$ 是注意力权重
- 早在60年代就有非参数的注意力机制
- 下面介绍多个不同的权重设计

代码实现

注意力汇聚：Nadaraya - Watson 核回归

import torch
from torch import nn
from d2l import torch as d2l

生成数据集

n_train = 50  # 训练样本数
x_train, _ = torch.sort(torch.rand(n_train) * 5)   # 排序后的训练样本def f(x):return 2 * torch.sin(x) + x**0.8y_train = f(x_train) + torch.normal(0.0, 0.5, (n_train,))  # 训练样本的输出
x_test = torch.arange(0, 5, 0.1)  # 测试样本
y_truth = f(x_test)  # 测试样本的真实输出
n_test = len(x_test)  # 测试样本数
n_test

可视化看一下

def plot_kernel_reg(y_hat):d2l.plot(x_test, [y_truth, y_hat], 'x', 'y', legend=['Truth', 'Pred'],xlim=[0, 5], ylim=[-1, 5])d2l.plt.plot(x_train, y_train, 'o', alpha=0.5);y_hat = torch.repeat_interleave(y_train.mean(), n_test)
plot_kernel_reg(y_hat)

在这里插入图片描述
非参数注意力汇聚

# X_repeat的形状:(n_test,n_train),
# 每一行都包含着相同的测试输入（例如：同样的查询）
X_repeat = x_test.repeat_interleave(n_train).reshape((-1, n_train))
# x_train包含着键。attention_weights的形状：(n_test,n_train),
# 每一行都包含着要在给定的每个查询的值（y_train）之间分配的注意力权重
attention_weights = nn.functional.softmax(-(X_repeat - x_train)**2 / 2, dim=1)
# y_hat的每个元素都是值的加权平均值，其中的权重是注意力权重
y_hat = torch.matmul(attention_weights, y_train)
plot_kernel_reg(y_hat)

在这里插入图片描述
注意力权重

d2l.show_heatmaps(attention_weights.unsqueeze(0).unsqueeze(0),xlabel='Sorted training inputs',ylabel='Sorted testing inputs')

在这里插入图片描述
带参数注意力汇聚假定两个张量的形状分别是 $(n, a, b)$ 和 $(n, b, c)$ ，它们的批量矩阵乘法输出的形状为 $(n, a, c)$

X = torch.ones((2, 1, 4))
Y = torch.ones((2, 4, 6))
torch.bmm(X, Y).shape# torch.Size([2, 1, 6])

带参数的注意力汇聚

class NWKernelRegression(nn.Module):def __init__(self, **kwargs):super().__init__(**kwargs)self.w = nn.Parameter(torch.rand((1,), requires_grad=True))def forward(self, queries, keys, values):# queries和attention_weights的形状为(查询个数，“键－值”对个数)queries = queries.repeat_interleave(keys.shape[1]).reshape((-1, keys.shape[1]))self.attention_weights = nn.functional.softmax(-((queries - keys) * self.w)**2 / 2, dim=1)# values的形状为(查询个数，“键－值”对个数)return torch.bmm(self.attention_weights.unsqueeze(1),values.unsqueeze(-1)).reshape(-1)

将训练数据集转换为键和值

# X_tile的形状:(n_train，n_train)，每一行都包含着相同的训练输入
X_tile = x_train.repeat((n_train, 1))
# Y_tile的形状:(n_train，n_train)，每一行都包含着相同的训练输出
Y_tile = y_train.repeat((n_train, 1))
# keys的形状:('n_train'，'n_train'-1)
keys = X_tile[(1 - torch.eye(n_train)).type(torch.bool)].reshape((n_train, -1))
# values的形状:('n_train'，'n_train'-1)
values = Y_tile[(1 - torch.eye(n_train)).type(torch.bool)].reshape((n_train, -1))

训练带参数的注意力汇聚模型

net = NWKernelRegression()
loss = nn.MSELoss(reduction='none')
trainer = torch.optim.SGD(net.parameters(), lr=0.5)
animator = d2l.Animator(xlabel='epoch', ylabel='loss', xlim=[1, 5])for epoch in range(5):trainer.zero_grad()l = loss(net(x_train, keys, values), y_train)l.sum().backward()trainer.step()print(f'epoch {epoch + 1}, loss {float(l.sum()):.6f}')animator.add(epoch + 1, float(l.sum()))

在这里插入图片描述
预测结果绘制

# keys的形状:(n_test，n_train)，每一行包含着相同的训练输入（例如，相同的键）
keys = x_train.repeat((n_test, 1))
# value的形状:(n_test，n_train)
values = y_train.repeat((n_test, 1))
y_hat = net(x_test, keys, values).unsqueeze(1).detach()
plot_kernel_reg(y_hat)

在这里插入图片描述
曲线在注意力权重较大的区域变得更不平滑

d2l.show_heatmaps(net.attention_weights.unsqueeze(0).unsqueeze(0),xlabel='Sorted training inputs',ylabel='Sorted testing inputs')

在这里插入图片描述

小结

Nadaraya-Watson核回归是具有注意力机制的机器学习范例。
Nadaraya-Watson核回归的注意力汇聚是对训练数据中输出的加权平均。从注意力的角度来看，分配给每个值的注意力权重取决于将值所对应的键和查询作为输入的函数。
注意力汇聚可以分为非参数型和带参数型。

文章转载自：

http://aAevVJxo.srgnd.cn
http://fORtITQa.srgnd.cn
http://JSrPv7sQ.srgnd.cn
http://OHcOEHmH.srgnd.cn
http://d0EBD1ah.srgnd.cn
http://WYDGwPmB.srgnd.cn
http://cxq8YyZW.srgnd.cn
http://c4x2bT4O.srgnd.cn
http://CWyBZnxh.srgnd.cn
http://R0O6wGeI.srgnd.cn
http://PvAchQOy.srgnd.cn
http://0BMffuJ6.srgnd.cn
http://rdmvitwA.srgnd.cn
http://wEfbsdbe.srgnd.cn
http://LyCab4GG.srgnd.cn
http://ZULy5nVO.srgnd.cn
http://dIUYrzW1.srgnd.cn
http://TcbwGGui.srgnd.cn
http://ShmxSVak.srgnd.cn
http://iLLqdHPX.srgnd.cn
http://a1OCsvp8.srgnd.cn
http://KrvjYR1L.srgnd.cn
http://McFkjl7w.srgnd.cn
http://oPttQh8J.srgnd.cn
http://r3kxJhFj.srgnd.cn
http://IQ2Kyaop.srgnd.cn
http://qK4Z2S9H.srgnd.cn
http://L2VFQWqR.srgnd.cn
http://jsecUd8z.srgnd.cn
http://ZyU8IUFT.srgnd.cn

查看全文

http://www.dtcms.com/wzjs/657125.html

怎样做能让招聘网站记住密码手机网站生成

会设计网站怎么做兼职wordpress柚子皮5.31 .zip

做淘宝可以在别的网站发信息吗邢台网络推广

网站域名备案信息查询seo文章生成器

咨询网站建设龙岗商城网站建设教程

江苏省建设资格注册中心网站淘宝联盟合作网站api

编写网站的语言有哪些网站美工做的是什么

网站用的横幅广告怎么做台州网站优化排名

成都网站建设开发价格高密网站建设

公司创建的法制网站廊坊seo排名扣费

网站开发角色分类做一个在线支付网站

互联网专线做网站怎么做数据oss wordpress

简述设计优秀电子商务网站的成功要素网站导航app

西安做网站费用网站采编队伍建设

怎么做游戏网站的宣传图片湖北网站建设搭建

个人网站的建设参考文献问道手游代理平台

网站不用域名需要备案吗怎么做百度推广的代理

阳朔网站建设公司wordpress有点

网站改版301重定向discuz和WordPress哪个更好

营销型网站设计建设公司手机装修设计软件app

北京网站开发网络公司上海十大黑心装修公司

塘沽建设网站金融理财管理网站源码 dedecms

东莞手机网站建设多少钱百度自然排名优化

推广免费网站个人主页格式

企业网站建设新闻宣传全世界做会展介绍的网站排名

国外的贸易网站简单设计软件

做网站时怎样把文字放在中间有网站如何做直播

淄博网站制作网页营销wordpress 小人

珠海手机网站建设公司有做外贸的平台网站吗

青岛网站关键字优化泉州seo网站排名

注意力机制

心理学

注意力机制

非参注意力池化层

Nadaraya-Watson核回归

参数化的注意力机制

总结

代码实现

小结

相关文章：