当前位置: 首页 > wzjs >正文

网站浏览排名网络推广有什么技巧没

网站浏览排名,网络推广有什么技巧没,百度对 wordpress 排名,建筑人才网官网 北京1 Transformer与注意力机制详解 本文直观上详细介绍了大语言模型中十分重要的结构——Transformer,及其核心:注意力机制的原理。 1. Transformer结构 基础结构如下图所示,左侧由一系列Encoder block(编码器)构成,接收字词句输入;右侧由一系列Decoder block(解码器)…

1 Transformer与注意力机制详解

本文直观上详细介绍了大语言模型中十分重要的结构——Transformer,及其核心:注意力机制的原理。

1. Transformer结构

基础结构如下图所示,左侧由一系列Encoder block(编码器)构成,接收字词句输入;右侧由一系列Decoder block(解码器)构成,输出结果。

project cover
每个Encoder-Decoder对构成Transformer的基本单元,细节结构如下图所示。其中,各部分作用为:
  • Embedding 层:将输入的字词句转为向量表示,每个词对应一个向量表示(维度人为指定)。如上图中的“我有一只猫”,一共五个词,若embedding的维度为64,则embedding后的矩阵为5*64。
  • Positional Encoding(位置编码)层:提取一句话中各个字词的前后位置关系,便于理解语义与逻辑。如“我有猫”和“猫有我”是完全不一样的意思,但所含的词是完全相同的。
  • Multi-Head Attention(多头注意力机制)层:用于捕获一句话中前后字词的注意力重点,如“我有一只猫”中,“有”和“猫”两个词的注意力得分就要大于“有”和“只”的,即提取句子中的前后主要逻辑关系。
  • Add&Norm层:进行残差连接和归一化
  • FeedForward层:包括两层线性变换,与一层非线性变换,通常是Relu,先将数据映射到高纬度的空间再映射到低纬度的空间,提取更深层次的特征
    在这里插入图片描述
    整体流程为(看完下述注意力机制再回来看会更明白些):Encoder模块对于输入提取注意力并进行线性变换,得到包括语句所有字词的信息结果,将其转换为k,v输入Decoder中;Decoder首先使用mask self attention得到前i个已知字词,将后面i+1个需要预测的字词都用mask掩盖,然后生成对应的q(查询); 最终,将两者的k,v,q共同输入Decoder的第二个self attention中计算,输出预测结果。

2. 注意力机制详解

注意力机制最核心的内容为Q、K、V三个参数,分别代表查询、键、值。其中,查询类似你在搜索引擎中输入的问题,键与值组成键值对作为庞大知识库中的内容。

  • Q、K、V定义以及关系
    Q:查询(维度通常为N × d,N是序列长度(即token 数量),d是词向量的维度(即embedding的维度),即Q代表查找的目标的关键字
    K:键(维度为Nd),即知识库内容V的简易总结版,用于接收查找Q的关键信息并与其进行相似度比对
    V:值(维度为N
    d),即每个K对应的内容
  • 注意力机制计算公式为:
    A t t e n t i o n ( Q , K , V ) = s o f t m a x ( Q K T ( d k ) ) V Attention(Q,K,V)=softmax(\frac{QK^T}{\sqrt(d_k)})V Attention(Q,K,V)=softmax(

文章转载自:

http://00000000.wqbrg.cn
http://00000000.wqbrg.cn
http://00000000.wqbrg.cn
http://00000000.wqbrg.cn
http://00000000.wqbrg.cn
http://00000000.wqbrg.cn
http://00000000.wqbrg.cn
http://00000000.wqbrg.cn
http://00000000.wqbrg.cn
http://00000000.wqbrg.cn
http://00000000.wqbrg.cn
http://00000000.wqbrg.cn
http://00000000.wqbrg.cn
http://00000000.wqbrg.cn
http://00000000.wqbrg.cn
http://00000000.wqbrg.cn
http://00000000.wqbrg.cn
http://00000000.wqbrg.cn
http://00000000.wqbrg.cn
http://00000000.wqbrg.cn
http://00000000.wqbrg.cn
http://00000000.wqbrg.cn
http://00000000.wqbrg.cn
http://00000000.wqbrg.cn
http://00000000.wqbrg.cn
http://00000000.wqbrg.cn
http://00000000.wqbrg.cn
http://00000000.wqbrg.cn
http://00000000.wqbrg.cn
http://00000000.wqbrg.cn
http://www.dtcms.com/wzjs/603097.html

相关文章:

  • 免费网站收录入口网站源码php
  • 如何做与别人的网站一样的get_category wordpress
  • 广州网站建设提供商您与此网站之间建立的连接不安全
  • 农业展示网站模板下载深圳百度seo整站
  • h5互动网站建设成都网站建设优化企业排名
  • 长沙建设工程造价网站网站开发框架系统
  • 中国风电商网站建设制作图片的软件及特点
  • 哪家公司网站建设好点中国科技成就总结
  • 彩票网站开发解决方案腾讯网站开发规范
  • 网站海外推广建设如何自己创建网站
  • 泉州做网站企业关注网站建设
  • hpsocket 网站开发网站开发报告多少页合适
  • 北京大学学术学风建设网站外贸推广平台有哪些
  • 团队网站模板前段 网站建设实例
  • 理财网站模板免费下载湛江做网站公司
  • h5企业模板网站模板wordpress配置文件是
  • 阳江网站建设黑龙江省建设信息网
  • 一级域名的网站怎么做wordpress 的论坛
  • 视频网站开发分析wordpress 七牛不更新
  • 河北手机版建站系统哪个好wordpress后台管理界面美化
  • 餐饮系统的网站应该怎么做江门关键词优化公司
  • 网站加地图标记清远新闻最新
  • linux系统服务器怎么做网站物联网技术应用是学什么的
  • 济南兼职做网站google seo 优化
  • 物流网站wordpress获取页面图片路径
  • 深圳商业网站建设哪家好成品网源码7w8w
  • 公司网站服务商商品seo优化是什么意思
  • 合肥做装修哪个网站好施工企业会计课后答案
  • 云南政务网站建设明年做哪些网站能致富
  • 母婴网站建设 社区产品设计专业就业前景如何