当前位置: 首页 > wzjs >正文

免费网站申请一般的电脑培训班要多少钱

免费网站申请,一般的电脑培训班要多少钱,青岛可以做网站的公司,河源网站建设文章目录 前言带全局语料统计的跳元模型GloVe模型从条件概率比值理解GloVe模型总结前言 在自然语言处理(NLP)的广阔天地中,如何让计算机理解人类语言的丰富内涵,一直是核心挑战。词嵌入(Word Embedding)技术为此提供了优雅的解决方案,它将词语映射到低维、稠密的向量空…

文章目录

  • 前言
  • 带全局语料统计的跳元模型
  • GloVe模型
  • 从条件概率比值理解GloVe模型
  • 总结


前言

在自然语言处理(NLP)的广阔天地中,如何让计算机理解人类语言的丰富内涵,一直是核心挑战。词嵌入(Word Embedding)技术为此提供了优雅的解决方案,它将词语映射到低维、稠密的向量空间中,使得语义相近的词在空间中的距离也相近。

我们之前已经熟悉了像Word2Vec这样的模型,它通过局部上下文窗口来学习词向量。然而,Word2Vec的视野有限,它一次只能看到一个小的上下文窗口,忽略了语料库中丰富的全局统计信息。

今天,我们将深入探讨另一种强大的词嵌入模型——GloVe(Global Vectors for Word Representation)。顾名思义,GloVe旨在融合两类词嵌入方法的优点:既能利用word2vec强大的局部上下文预测能力,又能结合LSA(Latent Semantic Analysis)等矩阵分解方法利用全局统计信息的能力。它通过对全局的“词-词共现矩阵”进行高效的学习,捕捉词语之间更深层次的语义关系。

本篇文章将详细拆解GloVe模型的数学原理,从它与跳元模型(Skip-gram)的联系出发,逐步揭示其巧妙的设计思想。虽然标题中带有“PyTorch版”,但理解其背后的数学原理是进行任何代码实现前至关重要的一步。让我们一起开始这场理论探索之旅吧!

原始内容:下载链接


带全局语料统计的跳元模型

要理解GloVe,我们不妨先回到熟悉的跳元模型(Skip-gram),并尝试用全局语料库的统计数据来重新审视它。

上下文窗口内的词共现可以携带丰富的语义信息。例如,在一个大型语料库中,“固体”比“气体”更有可能与“冰”共现,但“气体”一词与“蒸汽”的共现频率可能比与“冰”的共现频率更高。此外,可以预先计算此类共现的全局语料库统计数据:这可以提高训练效率。

q i j q_{ij} qij 表示词 w j w_j wj 的条件概率 P ( w j ∣ w i ) P(w_j \mid w_i) P(wjwi),在跳元模型中给定中心词 w i w_i wi,我们有:

q i j = exp ⁡ ( u j ⊤ v i ) ∑ k ∈ V exp ( u k ⊤ v i ) q_{ij}=\frac{\exp(\mathbf{u}_j^\top \mathbf{v}_i)}{ \sum_{k \in \mathcal{V}} \text{exp}(\mathbf{u}_k^\top \mathbf{v}_i)} qij=kVexp(ukvi)exp(ujvi)

其中,对于任意索引 i i i,向量 v i \mathbf{v}_i vi u i \mathbf{u}_i ui 分别表示词 w i w_i wi 作为中心词和上下文词的向量,且 V = { 0 , 1 , … , ∣ V ∣ − 1 } \mathcal{V} = \{0, 1, \ldots, |\mathcal{V}|-1\} V={0,1,,V1} 是词表的索引集。

[图片:一个中心词(如“learning”)及其上下文窗口(如“deep”, “from”, “code”)的示意图,突出“共现”的概念]

现在,让我们考虑整个语料库。词 w i w_i wi 可能出现多次。所有以 w i w_i wi 为中心词的上下文词,共同构成一个词索引的多重集 C i \mathcal{C}_i Ci(允许元素重复)。我们将多重集 C i \mathcal{C}_i Ci 中元素 j j j 的重复次数(重数)表示为 x i j x_{ij} xij。这其实就是词 w j w_j wj(作为上下文词)与词 w i w_i wi(作为中心词)在整个语料库的同一上下文窗口中的全局共现计数

利用这个全局统计量 x i j x_{ij} xij,跳元模型的损失函数可以等价地写成:

− ∑ i ∈ V ∑ j ∈ V x i j log ⁡ q i j - \sum_{i \in \mathcal{V}} \sum_{j \in \mathcal{V}} x_{ij} \log q_{ij} iVjVxijlogqij

我们进一步定义两个量:

  • x i = ∑ j ∈ V x i j x_i = \sum_{j \in \mathcal{V}} x_{ij} xi=
http://www.dtcms.com/wzjs/415383.html

相关文章:

  • 网站建设方案设计是什么意思百度seo和sem的区别
  • 云南网站建设企业网站seo推广营销
  • 怎样做才能让百度前两页有自己网站内容杭州seo服务公司
  • 哪里有网站建设哪家好宿迁网站建设制作
  • 昆明网站制作最新病毒感染什么症状
  • 南京建设网站排名bt最佳磁力搜索引擎
  • 做卡盟网站一个新手怎么去运营淘宝店铺
  • 如何建设公司网络营销网站今日国内新闻最新消息大事
  • 网站建设的网络公司螺蛳粉的软文推广
  • 建设银行官方网站登录网址北京网站建设公司报价
  • 为什么搜索不到刚做的网站衡阳seo优化报价
  • 网站源码程序下载房地产销售怎么找客户
  • 做网站怎么更新静态页企业网站模板
  • 做淘宝客网站要注意什么引擎搜索技巧
  • 海南做网站的公司哪家好台湾永久免费加密一
  • wordpress排版界面安卓神级系统优化工具
  • 网站建设公司 信科便宜推广官网
  • 江苏做网站网站推广的常用途径有哪些
  • 济南 网站定制网上推销产品去什么平台
  • 自己做的网站怎样链接数据库免费发广告的平台
  • wordpress+小米商城主题seo的工作内容主要包括
  • 海外网络是什么意思百度移动seo首选帝搜软件
  • 东莞网站开发网站建设制作费用网络推广整合平台
  • 做网站多久能学会注册网站需要多少钱?
  • wordpress 关闭缓存网站关键词排名优化电话
  • 上海工程建设招投标网站网站权重是怎么提升的
  • 网站建设合作品牌杭州专业seo
  • 求大佬给个资源找累了东莞搜索网络优化
  • 我的世界充值网站怎么做快速优化网站排名的方法
  • 邢台地区网站建设独立seo引擎搜索网站