当前位置: 首页 > wzjs >正文

手机膜+东莞网站建设建站

手机膜+东莞网站建设,建站,江苏SEO网站建设,十堰做网站最好的公司一、注意力提示 随意:跟随主观意识,也就是指有意识。 注意力机制:考虑“随意线索”,有一个注意力池化层,将会最终选择考虑到“随意线索”的那个值 二、注意力汇聚 这一部分也就是讲第一大点中“注意力汇聚”那个池化…

一、注意力提示

随意:跟随主观意识,也就是指有意识。

注意力机制:考虑“随意线索”,有一个注意力池化层,将会最终选择考虑到“随意线索”的那个值

二、注意力汇聚

这一部分也就是讲第一大点中“注意力汇聚”那个池化层如何实现池化操作。

1.非参注意力池化层

为什么叫“非参”呢?因为这里定义的池化层函数,函数中所用到的数据均来源于之前的变量,不需要学习任何参数,K是一个函数。

这里的query、key、value不懂是什么意思,好像和理解的函数对应不上,李沐没讲

1.1平均池化

这是最简单的池化方案,就是求解平均值,然后映射到value(值)上。

1.2NW核回归

就是K这个函数选取高斯核K(u),然后入代到上面的池化函数中。

2.参数注意力池化层

就是引入了一个可以学习的w作为参数,每次进行迭代。

二、注意力分数

1.基本介绍

就是说池化层的池化函数关键在于如何定义函数a,函数a就是注意力分数,softmax其实就是将其转换到0-1上,都弄成正的小数。

2.函数a的定义方式

2.1可加性的注意力

可加性的注意力,将函数a定义为上面所示的样子,其实就是将key和value合并起来,具体怎么个意思没太懂。 

2.2Scaled Dot-Production Attention

三、自注意力

1.基本含义

将Xi当作key,value,query来提取序列特征。

 2.位置编码

3.位置编码矩阵

这个矩阵P就是计算的出的矩阵X的位置信息编码矩阵。从图中可以看出,其实就是将位置信息加到了矩阵X输入上去。

4.绝对位置信息

对每个样本都给一个独一无二的位置信息,将这个位置信息加到原矩阵信息上去。

 5.相对位置信息

四、Transformer

沐神说:老大的小孩过来看到BERT说,欸这不是芝麻街......

1.架构

2.多头注意力

 

http://www.dtcms.com/wzjs/512238.html

相关文章:

  • 肖鸿昌建筑网站广告联盟平台哪个好
  • 宁夏百度网站怎么做武汉百度推广代运营
  • app下载导航南昌网优化seo公司
  • wordpress缩略图地址seo关键词找29火星软件
  • 教学网站建设企业全网推广
  • 如何诊断网站企业站seo报价
  • 环保网站建设说明百度指数平台
  • wordpress 优化''seo推广如何做
  • 远近互联网站建设企业管理软件
  • b2c电子商务网站功能模块怎样做网站推广
  • 十堰网站制作公司网络广告图片
  • 响应式网站模板下载免费餐饮营销引流都有什么方法
  • 网站做的app有哪些网页设计学生作业模板
  • 宜昌市做网站基本营销策略有哪些
  • 无锡网站建设方案哪个搜索引擎能搜敏感内容
  • 做seo推广手机网站磁力天堂最新版地址
  • wap网站cms智能建站系统
  • 做网站菠菜什么意思营销平台
  • wordpress查询数据库插件seo优化公司信
  • 网站集群 建设方案seo网站排名查询
  • 做网盘搜索网站合法吗seo搜索引擎优化包邮
  • 论述题亿唐网不做网站做品牌seo关键词大搜
  • 邯郸永年疫情最新情况网站seo优化外包顾问
  • wordpress好用的地图360优化大师旧版本
  • 怀化公积金网站百度运营平台
  • 网站建设营销话术百度资源提交
  • 唯美网站建设2024年重大政治时事汇总
  • 企业微信官方网站市场营销的八个理论
  • python开发一个wordpressseo的优点有哪些
  • 阿里云代理网站怎么做北京营销型网站