当前位置: 首页 > wzjs >正文

南宁网站制作sem竞价托管

南宁网站制作,sem竞价托管,江阴建设局官方网站,沈阳建站免费模板文章目录 前言带全局语料统计的跳元模型GloVe模型从条件概率比值理解GloVe模型总结前言 在自然语言处理(NLP)的广阔天地中,如何让计算机理解人类语言的丰富内涵,一直是核心挑战。词嵌入(Word Embedding)技术为此提供了优雅的解决方案,它将词语映射到低维、稠密的向量空…

文章目录

  • 前言
  • 带全局语料统计的跳元模型
  • GloVe模型
  • 从条件概率比值理解GloVe模型
  • 总结


前言

在自然语言处理(NLP)的广阔天地中,如何让计算机理解人类语言的丰富内涵,一直是核心挑战。词嵌入(Word Embedding)技术为此提供了优雅的解决方案,它将词语映射到低维、稠密的向量空间中,使得语义相近的词在空间中的距离也相近。

我们之前已经熟悉了像Word2Vec这样的模型,它通过局部上下文窗口来学习词向量。然而,Word2Vec的视野有限,它一次只能看到一个小的上下文窗口,忽略了语料库中丰富的全局统计信息。

今天,我们将深入探讨另一种强大的词嵌入模型——GloVe(Global Vectors for Word Representation)。顾名思义,GloVe旨在融合两类词嵌入方法的优点:既能利用word2vec强大的局部上下文预测能力,又能结合LSA(Latent Semantic Analysis)等矩阵分解方法利用全局统计信息的能力。它通过对全局的“词-词共现矩阵”进行高效的学习,捕捉词语之间更深层次的语义关系。

本篇文章将详细拆解GloVe模型的数学原理,从它与跳元模型(Skip-gram)的联系出发,逐步揭示其巧妙的设计思想。虽然标题中带有“PyTorch版”,但理解其背后的数学原理是进行任何代码实现前至关重要的一步。让我们一起开始这场理论探索之旅吧!

原始内容:下载链接


带全局语料统计的跳元模型

要理解GloVe,我们不妨先回到熟悉的跳元模型(Skip-gram),并尝试用全局语料库的统计数据来重新审视它。

上下文窗口内的词共现可以携带丰富的语义信息。例如,在一个大型语料库中,“固体”比“气体”更有可能与“冰”共现,但“气体”一词与“蒸汽”的共现频率可能比与“冰”的共现频率更高。此外,可以预先计算此类共现的全局语料库统计数据:这可以提高训练效率。

q i j q_{ij} qij 表示词 w j w_j wj 的条件概率 P ( w j ∣ w i ) P(w_j \mid w_i) P(wjwi),在跳元模型中给定中心词 w i w_i wi,我们有:

q i j = exp ⁡ ( u j ⊤ v i ) ∑ k ∈ V exp ( u k ⊤ v i ) q_{ij}=\frac{\exp(\mathbf{u}_j^\top \mathbf{v}_i)}{ \sum_{k \in \mathcal{V}} \text{exp}(\mathbf{u}_k^\top \mathbf{v}_i)} qij=kVexp(ukvi)exp(ujvi)

其中,对于任意索引 i i i,向量 v i \mathbf{v}_i vi u i \mathbf{u}_i ui 分别表示词 w i w_i wi 作为中心词和上下文词的向量,且 V = { 0 , 1 , … , ∣ V ∣ − 1 } \mathcal{V} = \{0, 1, \ldots, |\mathcal{V}|-1\} V={0,1,,V1} 是词表的索引集。

[图片:一个中心词(如“learning”)及其上下文窗口(如“deep”, “from”, “code”)的示意图,突出“共现”的概念]

现在,让我们考虑整个语料库。词 w i w_i wi 可能出现多次。所有以 w i w_i wi 为中心词的上下文词,共同构成一个词索引的多重集 C i \mathcal{C}_i Ci(允许元素重复)。我们将多重集 C i \mathcal{C}_i Ci 中元素 j j j 的重复次数(重数)表示为 x i j x_{ij} xij。这其实就是词 w j w_j wj(作为上下文词)与词 w i w_i wi(作为中心词)在整个语料库的同一上下文窗口中的全局共现计数

利用这个全局统计量 x i j x_{ij} xij,跳元模型的损失函数可以等价地写成:

− ∑ i ∈ V ∑ j ∈ V x i j log ⁡ q i j - \sum_{i \in \mathcal{V}} \sum_{j \in \mathcal{V}} x_{ij} \log q_{ij} iVjVxijlogqij

我们进一步定义两个量:

  • x i = ∑ j ∈ V x i j x_i = \sum_{j \in \mathcal{V}} x_{ij} xi=
http://www.dtcms.com/wzjs/384361.html

相关文章:

  • jsp网站开发遇到问题国内新闻摘抄
  • wordpress网站做成苹果app太原网站推广公司
  • 郑州企业网站制作怎么做seo点击
  • 公司的网站是什么网站推广应该坚持什么策略
  • wordpress 黑体36优化大师下载安装
  • 企业网站的完整性包括哪些百度百科官网登录
  • 万网做网站怎么样miy188coo免费入口
  • 织梦cms漫画模板衡水网站seo
  • 做网站维护的收入怎么确认百度地图人工客服电话
  • 求人做网站希爱力吃一颗能干多久
  • 做百度网站百度推广费用多少
  • 免费友情链接平台青岛seo软件
  • 华亭网站建设百度seo排名优化是什么
  • 在深圳做网站多少钱广点通广告投放平台
  • 做整个网站静态页面多少钱优化网站排名茂名厂商
  • 计算机专业代做毕设哪个网站靠谱教育培训机构报名
  • 的动态网站开发著名的个人网站
  • 河北做wap网站关键词优化排名用哪些软件比较好
  • 大良网站智能推广价格虞城seo代理地址
  • 我建设的网站打开很慢网站管理系统
  • 徐州做网站多少钱培训学校怎么招生
  • 北海做网站网站建设seo哪家好
  • 形容网站做的好的词语网站优化入门免费教程
  • 教育局门户网站建设目的每日新闻简报
  • 昆明网站建设公司排行合肥网站优化技术
  • 做批发服装的网站网络营销课程学什么
  • 石家庄做外贸网站建设seo搜索引擎优化知乎
  • 大学生婚恋网站策划书培训班有哪些
  • 新网站排名优化怎么做新手怎么学电商运营
  • 网站开发薪水一般多少钱一元友情链接平台