当前位置: 首页 > wzjs >正文

百度收录左侧带图片的网站关键词排名关键词优化

百度收录左侧带图片的网站,关键词排名关键词优化,易语言对做网站有什么帮助,中山精品网站建设新闻GPT-1 架构特点 仅解码器架构:摈弃了传统transformer中的编码器层,而是直接用解码器和自注意力,同时抛弃掉了交叉多头注意力层,自注意力通过mask来完成计算。注意力块添加到12个,Attention的输出维数为762维&#xff0…

GPT-1

架构特点

  1. 仅解码器架构:摈弃了传统transformer中的编码器层,而是直接用解码器和自注意力,同时抛弃掉了交叉多头注意力层,自注意力通过mask来完成计算。
  2. 注意力块添加到12个,Attention的输出维数为762维,FeedForward的升维维数增加到2048维。总参数量达1.5亿(0.15B)。
  3. 可学习的位置编码:位置编码不再使用固定的公式计算,而是作为神经网络参数的一部分进行学习。

训练过程

无监督预训练

给定一个句子,无监督预训练做的就是根据之前的token预测下一个token,每个batch里面包含的是该句子的前若干个token组成的输入,(但是实际实现中不会真的去这样做切分,而是用注意力掩码来控制注意力的计算)。输出是对应的下一个token。

每一个token的注意力嵌入最后通过前馈网络都能生成下一个token的预测,最终根据每一个token预测计算交叉熵平均损失,从而得到这个输入的训练损失。

有监督微调

与预训练的方法类似,但是存在以下两个区别:

  • 训练数据的内容是人为标注的,符合人们对模型的工具定位,要求模型必须按用户的需求回答
  • 在计算损失部分,不会把prompt部分的自损失计算上,而只会计算人为标注的输出部分的每个token预测的损失平均值。

GPT-1的缺陷

  • GPT-1使用的Transformer Decoder是单向语言模型,提取信息的能力不如Bert,但生成文本的能力很强
  • GPT-1针对每一个下游任务都需要训练一个模型,工作量大

BERT

架构特点

  1. BERT编码器架构所以BERT丧失输出文本能力
  2. BERT输入进行嵌入除了常规嵌入位置编码BERT还会句子序列序列进行编码

此处我们可以看到两个特殊标识[CLS][SEP],它们没有自身语义[CLS]表示序列开头[SEP]表示句子结尾BERT输入只会1 - 2 序列

如果输入两个序列第二个序列段落编码1否则段落编码0.

序列编码示例

  1. <CLS> my dog is cute <SEP> --> 0 0 0 0 0 0
  2. <CLS> my dog is cute <SEP> he likes play ##ing <SEP> ---> 0 0 0 0 0 0 1 1 1 1 1

训练过程

BERT预训练过程包括两个任务

掩码语言模型MLM)

15% 概率随机句子某个token替换 [MASK] , 随后模型预测位置对应token什么这样可以模型更好捕捉语义

  • 存在问题模型过于关注[MASK]这个token但是下游任务并不会出现[MASK],所以可能出现过拟合现象
  • 解决方案选择token之后三种选择
    • 替换[MASK] token
    • 替换其他随机token
    • 不替换

由于模型不知道句子对应token是否token所以模型尝试根据句子语义找到token

邻接序列预测NSP)

输入两个序列模型判断两个序列是否语义相关联或者后面序列是否语料前面序列临近

  • 通过CLS向量信息进行二分类因为CLS本身没有语义信息内部信息只能句子整体信息

举例

Input1=[CLS] the man went to [MASK] store [SEP] he bought a gallon [MASK] milk [SEP]Label1=IsNextInput2=[CLS] the man [MASK] to the store [SEP] penguin [MASK] are flight ##less birds [SEP]Label2=NotNext

应用场景

句子分类
句子情感预测
语句问答
标注标注句子出现每一个token标签

缺陷

BERT失去了文本生成的能力,换来了更强的信息提取能力

http://www.dtcms.com/wzjs/131513.html

相关文章:

  • 仪征做网站百度推广关键词怎么优化
  • 龙山建设工程有限公司网站互联网营销工具有哪些
  • 做网站要会哪些知识杭州seo薪资水平
  • 免费网站哪个好西安百度推广开户运营
  • 整站优化与关键词排名sem是什么意思?
  • 怎么建立一个网站放图片深圳今天重大事件新闻
  • 网页编辑器在线使用百度关键词优化怎么做
  • 免费授权企业网站源码网络广告策划的内容
  • 最优做网站在线刷seo
  • 嘉定区网站建设广州疫情最新数据
  • 创意网站制作推广如何做网上引流
  • 崇明网站开发哪里有竞价推广托管
  • 肥城网站建设广州外地车牌seo快排公司哪家好
  • 国家外管局网站怎么做收汇seo免费优化工具
  • 找山东制作app公司西安网站排名优化培训
  • 怎么做网站收广告费青岛网站关键词优化公司
  • 深圳做网站要建站教程
  • 网站建设哪家性价比高搜索引擎优化结果
  • 北京公司网站建设整合营销传播最基础的形式是
  • 在线视频网站开发微信软文范例
  • 美武汉有什么网站建设公司seo 论坛
  • 浙江台州做网站的公司有哪些网络营销的工作内容包括哪些
  • 推进门户网站建设怎么提高关键词搜索权重
  • 室内装饰设计师证书含金量关于seo如何优化
  • 可拖拽编程网站开发做高端网站公司
  • 怎么确认网站是什么语言做的百度帐号
  • wordpress发布文章页面错误seo关键词排名优化费用
  • 公司网站是做的谷歌的产品营销策划方案3000字
  • 太原企业建站程序网站快速排名的方法
  • 杭州倍世康 做网站网站运营seo实训总结