当前位置: 首页 > wzjs >正文

住房城市乡建设部网站无锡网站建设方案优化

住房城市乡建设部网站,无锡网站建设方案优化,确定网站风格,安阳新闻最新消息【文本】词嵌入经典模型:从one-hot到BERT one-hot编码(独热编码): 根据词表的所有词构建一个向量特征。每一个文段中每个单词有一个词向量(二进制且只有一位为1) — 稀疏、缺乏语义(father&am…

【文本】词嵌入经典模型:从one-hot到BERT

one-hot编码(独热编码):

  • 根据词表的所有词构建一个向量特征。每一个文段中每个单词有一个词向量(二进制且只有一位为1) — 稀疏、缺乏语义(father&mother;like&love)

word2vec编码:

  • 原则:“一个词被周围的词所代表”
    • 有两种模型:CBOW(Continuous Bag of Words) 上下文单词预测目标单词(完形填空)Skip-Gram 目标单词预测上下文单词(造句),中心词可替换,上下文不变,那就是相似的词
  • 步骤:
    • 随机初始化向量表示,经历无数次训练(如下)
    • 正样本:-(正向传播)将中心词和上下文两个词向量输入神经网络,模型中输出的是“是否为上下文的概率”-(反向传播)概率不符合实际(损失函数大),则更新神经网络模型的参数(根据梯度调整权重),以及两个词的向量表达,使得下次预测更接近于1(学到了中心词的语义)
    • 负样本:使其概率更接近0
  • — 确乏全文信息;无法解决一词多义

Bert模型

  • Bert模型基于transformer架构,加入句向量(解决全文信息),可以处理一词多义
  • 苹果(中心词)的语义信息,由句子内所有上下文的单词有关,整个句子信息都要混入当前单词中(self-attention,用文本中的更多上下词,增加目标此语义,中心词语义=∑所有词*权重,权重由模型训练)
  • — 考虑完形填空(MLM任务),在训练时随机替换句子中一些词为mask。一个单词被mask掉后,根据句子中其他词的语义中混合的信息,反向猜出被mask的词,输出的mask词预测是一个概率分布,表示每个单词被成功预测的概率,目标是向1训练(减少损失函数);没有负样本训练。
  • — 考虑续写(NSP任务),即句子间训练(模型接收一对句子,判断第二个句子是否是第一个句子的下一句),帮助理解句子间逻辑
    • — CLS特殊符号,排入开头位值,但是没有自己语义(所以能够表示整个句子信息—存在争议)
http://www.dtcms.com/wzjs/449305.html

相关文章:

  • 两学一做知识竞赛试题网站搜索关键词分析
  • 西安微官网自助建站公司网站搜索量查询
  • 做网页的网站素材企业seo网站营销推广
  • 毕业论文做cad图的网站营销推广文案
  • 网站上网络营销qq群引流推广平台
  • 网站扫码登录怎么做百度下载2021新版安装
  • 网站建设维护培训网络推广网站大全
  • 北京网站设计价格安徽网站关键字优化
  • 如何建设数据报表网站合肥网站建设公司
  • 为了推出企业网站建设seo优化点击软件
  • 手机网站接入微信登录产品线上营销方案
  • 学会网站建设的重要性免费建一个自己的网站
  • .net网站项目有哪些百度百科合作模式
  • 有哪些做简历的网站谷歌账号
  • 页面访问将在5秒后自动跳转360优化大师最新版的功能
  • 山东高密网站建设上海网络推广公司网站
  • 做网站需要到什么技术宝鸡seo外包公司
  • 免费建站的方法广州关于进一步优化疫情防控措施
  • 温州阀门网站建设seo关键词优化排名公司
  • 班级网站网页设计网络营销渠道可分为
  • 怎样收录网站seo实战技巧100例
  • 做电商需要哪些网站有哪些注册域名查询网站官网
  • 普象工业设计网官网seo网站排名全选
  • 做淘宝美工需要知道的网站软件外包企业排名
  • 网站服务器 优帮云比较好的网络优化公司
  • 祭祀网站建设方案百度推广多少钱
  • 长沙网页设计有限公司优化网站性能
  • c web网站开发视频太仓网站制作
  • 怎么做网站推成人专业技能培训机构
  • 管理系统考生端重置密码seo是什么职位缩写