当前位置: 首页 > wzjs >正文

百度公司官方网站陕西省交通建设厅网站

百度公司官方网站,陕西省交通建设厅网站,制作相册,少女たちよ在线观看动漫4传统的1 of N 的encoding无法让意义相近的词汇产生联系,word class可以将相近的词汇放到一起 但是word class不能表示class间的关系,所以引入了word embedding(词嵌入) 我们生成词向量是一种无监督的过程(没有label 自编码器是一种人工神经网络,主要用于无监督学习…

传统的1 of N 的encoding无法让意义相近的词汇产生联系,word class可以将相近的词汇放到一起

但是word class不能表示class间的关系,所以引入了word embedding(词嵌入)

我们生成词向量是一种无监督的过程(没有label

自编码器是一种人工神经网络,主要用于无监督学习,它的目标是学习一种“压缩”数据的方式,然后再“还原”数据。
简单来说,自编码器可以把高维数据压缩成低维的“编码”,再从这个编码还原出原始数据。

通过这个过程,网络学会了如何用更少的信息表达原始数据的主要特征

count based

  • 如果两个词(比如 (w_i) 和 (w_j))经常一起出现在同一个上下文中(比如同一句话、同一段落),那么它们的词向量 (V(w_i)) 和 (V(w_j)) 应该在向量空间中距离较近。
  • 这种方法的核心是共现矩阵(co-occurrence matrix):统计每对词在同一上下文中出现的次数 (N_{i,j})。

  • 不是直接统计词与词的共现次数,而是通过神经网络模型,用一个词去预测它的上下文,或者用上下文去预测中心词
  • 通过训练神经网络,让词向量在预测任务中不断优化,最终得到能表达语义的词向量。

我们想要将input的后一个词是一样的,我们就要将input的两个词放置在同一空间的相邻位置,我们就要通过w来调整,第一个隐藏层的权重矩阵就是我们要的词向量(word embedding)

我们input可以不止一个词,因为都是one hot,所以可以连在一起丢进去就行

  • 假设你有一个词表,每个词都有一个词向量(比如300维)。
  • 不管这个词出现在输入的哪个位置(比如上下文的第一个词、第二个词),它的词向量都是同一组参数,不会因为位置不同而变成不同的向量。
  • 这就是参数共享(parameter sharing),如图中不同输入(w_{i-2}、w_{i-1})连到隐藏层的线条有相同颜色,表示用的是同一组权重。
  • 对于同一个词,比如“蔡英文”,它的词向量(比如第1维、第2维……第300维)在所有输入位置都是一样的。
  • 也就是说,不管“蔡英文”出现在w_{i-2}还是w_{i-1},它的第1维、第2维……第300维的值都一样。

  • w 在这里就是词向量(word embedding),也是embedding层的权重。
  • 每个词都有自己的词向量,不是所有词共享一个向量。
  • 词向量矩阵的每一行对应一个词,内容不同,结构相同。

z 不是预测的词本身,也不是预测词的词向量,而是“上下文的综合表示”,也就是用来预测下一个词的“隐藏层输出”或“上下文向量”。

  • 每个 one-hot 向量(比如 (x_{i-2}))
    乘以权重矩阵 (W_1) 后,实际上就是“选中”了 (W_1) 的某一行,这一行就是 (x_{i-2}) 这个词的词向量(在 (W_1) 这个矩阵里的表示)。

  • 同理,(x_{i-1}) 乘以 (W_2)
    就是选中 (W_2) 的某一行,这一行就是 (x_{i-1}) 这个词的词向量(在 (W_2) 这个矩阵里的表示)。

  • z = W1 * x_{i-2} + W2 * x_{i-1}
    就是把这两个词的词向量加起来,作为上下文的综合表示。

  • 实际应用中,通常所有上下文词共享同一个权重矩阵(embedding table)。

那我们怎么让wi和wj一样呢

  • 每个词都需要有自己独立的词向量,不能只用一个w。(除非是usa和美国这种实际上是一样的词
  • 参数共享的是结构,不是内容。
  • 分别更新每个词的向量,才能让模型学到丰富的语义信息。

例子

还有其他的prediction based

其实这些network不是deep的,只有一个network

word embedding处理相关联的词

但是如果project的是中文context,我们是无法知道对应英文的,只有将中文和英文分别project到空间中的同一点才行


文章转载自:

http://87Odld8R.Ljpqy.cn
http://8AfHplt7.Ljpqy.cn
http://EqKhFVa8.Ljpqy.cn
http://XM4D7siX.Ljpqy.cn
http://szZ4Kcom.Ljpqy.cn
http://NKOGc5XV.Ljpqy.cn
http://8RZ6QSq4.Ljpqy.cn
http://Fc8QH1bx.Ljpqy.cn
http://88uILP35.Ljpqy.cn
http://0ptQQRvH.Ljpqy.cn
http://XJc1Fzcz.Ljpqy.cn
http://icheGnEr.Ljpqy.cn
http://j0ySenNB.Ljpqy.cn
http://Q8nEwQlu.Ljpqy.cn
http://plObbDB5.Ljpqy.cn
http://xtSwDUYS.Ljpqy.cn
http://zzg3tXHN.Ljpqy.cn
http://hZpwjRyU.Ljpqy.cn
http://A7WHVTfZ.Ljpqy.cn
http://QALiGsuh.Ljpqy.cn
http://uWPBDq1N.Ljpqy.cn
http://mXHzGYXS.Ljpqy.cn
http://sKkJ3Svj.Ljpqy.cn
http://WnLxmhjV.Ljpqy.cn
http://BSvS2qKU.Ljpqy.cn
http://tjx9gaPL.Ljpqy.cn
http://WcyOfwop.Ljpqy.cn
http://L2eA5lpl.Ljpqy.cn
http://iRvSsfb6.Ljpqy.cn
http://osujB9ev.Ljpqy.cn
http://www.dtcms.com/wzjs/685701.html

相关文章:

  • 塔城市建设局网站杭州久邦电力建设有限公司网站
  • 宜春网站建设联系方式网站经营性备案难不难
  • 做淘宝内部优惠券网站要钱么菜鸟零基础如何自学编程
  • 做盗文网站大创意网站
  • 网站优化提升排名免费公司网址怎么注册
  • 美食网站 原型 html 下载mui做浏览器网站跳转
  • 禅城做网站宁波城乡建设局管方网站
  • 顺德 网站设计建设项目银行网站
  • 深圳建设网站商天眼查官网查询企业
  • 开发一个网站的流程福州网
  • 怎样在阿里巴巴做网站北京手机网站设计公司
  • 软件网站关键词优化做网站公司没签合同
  • 企业做商城网站需要什么资质网站建设ssc源码平台
  • 漯河网站建设漯河什么网页传奇好玩
  • 购买完域名后怎么做网站英文网站制作
  • 大连华南网站制作公司企业公众号以及网站建设
  • 网站的优化排名怎么做营销网站的优势是什么
  • 做新媒体应该关注什么网站重庆网站建设必选承越
  • 建设网站项目总结wordpress音频播放器
  • 富阳住房和城乡建设部网站免费做图片链接网站
  • 织梦可以做婚纱影楼网站吗公司做网站需要准备哪些资料
  • 网站效果图确认表学校建设网站的意义
  • 深圳做网站最好的公热门传奇网页游戏排行榜
  • 淄博建设网站宁波网站建设排名
  • 免费网站推广文章企业门户网站制作价格怎么算
  • 做一个信息网站多少钱深圳网站建设的费用
  • 网站会员充值做哪个分录wordpress 喜欢
  • 广州从化建设网站官网网页内嵌网站
  • 做网站常用的语言郑州网站建设优化公司
  • 石家庄网络建站深圳招聘网最新招聘信息