当前位置: 首页 > wzjs >正文

河南高端建设网站免费b站在线观看人数在哪

河南高端建设网站,免费b站在线观看人数在哪,深圳vi设计内容,wordpress无法启动一、前言 本文章作为学习2023年《李宏毅机器学习课程》的笔记,感谢台湾大学李宏毅教授的课程,respect!!! 二、大纲 何为self-Attention?原理剖析self-Attention VS CNN、RNN、GNN 三、何为self-Attenti…

一、前言

本文章作为学习2023年《李宏毅机器学习课程》的笔记,感谢台湾大学李宏毅教授的课程,respect!!!

二、大纲

  • 何为self-Attention?
  • 原理剖析
  • self-Attention VS CNN、RNN、GNN

三、何为self-Attention?

2014年就提出,但发扬光大是在2017年的Transformer 论文《Attention Is All You Need》。广泛应用在seq2seq模型中,这里就不得不举几个seq2seq的应用场景。

  • seq2seq(sequence to sequence)
    顾名思义就是输入是序列,输出也是序列,简言之输入是一排向量,输出是另外一排向量,例如:

在这里插入图片描述

四、原理剖析

  • 划重点:self-attention的精髓就是考虑上下文语义信息。

那如何考虑上下文语义信息呢? 对,就是计算相关性。
在这里插入图片描述
例如输入是一个句子,那就不单单考虑一个词了,而是和句子中不同位置的词语计算相关性,对应输出得分。

那如何计算相关性呢?
那就有百百中做法,现在举两种常见方法:
在这里插入图片描述
1、Dot-product
设有两个矩阵Wq和Wk,输入经过它们得到输出,再做点乘能够计算成输入的相关性a,具体这两个矩阵长啥样就是我们要训练出来的。

2、Additive
设有两个矩阵Wq和Wk,输入经过它们得到输出,然后相加并送入激活函数tanh,再经过W得到输出a。

感觉抽象的话,就只需要记住这步操作就是要把计算相关性的矩阵参数学出来,这是目的。

知道怎么计算了,那就实做一下。
在这里插入图片描述
说明: 要计算a1和a2、a3、a4的相关性,那就采用上述的dot-product方法两两计算,再送入softmax。q常称为query,k称为key。

接下来,再找一个v矩阵,可以理解v这个矩阵是输入的资讯,根据q和k内积的相关性得分来抽取资讯。
在这里插入图片描述
位置咨询(Positional Encoding)
在这里插入图片描述
位置资讯就是在输入时候加入e,是人为设置的。

以上就是self-attention的原理了。

小结
self-attention就是找三个矩阵q、k、v,前两个用于计算相关性,后一个的资讯信息。一言以蔽之就是根据相关性把资讯抽出来。优点是平行计算,加快速度。

变种(Multi-head Self-attention)

  • multi-head Self-attention
    就是q,k,v可以分成多个,相互独立进行运算
    在这里插入图片描述

五、self-Attention 对比

self-Attention VS CNN
self-attention 应用在目标检测、CNN上,CNN的感受野考虑的是周围8个像素的资讯,self-attention则计算整图并动态生成感受野,其实就是挑选与当前像素相关的像素。
在这里插入图片描述

self-Attention VS RNN
RNN一步步往下,并不是并行化,而self-attention并行给出输出,一次到位速度取胜。
在这里插入图片描述

self-Attention VS GNN
因为图有边相接,所以self-attention与哪个节点有关可以直接表达出来。
在这里插入图片描述

六、小结

至此,self-attention的技术介绍完毕,整体理解运算过程,记住q,k,v三个主要的矩阵,重点应用于seq2seq模型,尤其是现在爆红的chatGPT也是用的Transformer,而transformer的核心就是self-attention。

http://www.dtcms.com/wzjs/158610.html

相关文章:

  • 网站开发课程软件全球搜索
  • 长沙网络公司北京网站优化专家
  • 校园网站策划书河南seo排名
  • 广州网站开发水平广州亦客网络今天重大新闻国内最新消息
  • 深圳网站改版公司百度信息流推广
  • 做爰全过程免费的视频网站广告引流推广平台
  • 织梦程序做交友网站友情链接买卖代理
  • 胡志明网站建设搜狗seo查询
  • 北京门户网站有哪些百度商务合作联系
  • 哪里有做彩票网站了谷歌关键词优化怎么做
  • 国内公司名字可以做国外网站下载百度app最新版
  • 开发大型网站的流程网站开发是做什么的
  • 青岛公司网站建设公司排名关键词排名点击软件网站
  • 宾川网站建设蔡甸seo排名公司
  • 独立网站商城怎么做如何设计企业网站
  • wordpress图文插件黑帽seo是什么意思
  • 最新常州网页制作招聘免费关键词排名优化软件
  • 文库网站建设2023年6月疫情恢复
  • 官方网站建设意义seo岗位是什么意思
  • 织梦源码怎样做单页网站百度搜索排名服务
  • 企业网站开发一般多少钱佛山seo网站排名
  • 嘉兴网站备案微信seo是什么意思
  • 深圳哪个公司做网站好电脑优化大师哪个好
  • 单页网站建设平台营销策略都有哪些
  • 1元涨1000粉丝网站建站系统哪个好
  • 在哪里建设网站防疫管控优化措施
  • 电商关键词seo排名抖音优化
  • 网站菜单怎么做网上营销是干什么的
  • 德文网站建设网络营销有哪些功能
  • 东莞房价走势最新消息seo sem是什么意思