当前位置: 首页 > wzjs >正文

怎么做网站登陆战温江做网站哪家好

怎么做网站登陆战,温江做网站哪家好,电影网站建设的核心是,深圳网站建设公司推荐乐云seoCE、NCE、InfoNCE的演变过程及数学推导和关系 在机器学习和深度学习中,交叉熵( C E CE CE)、噪声对比估计( N C E NCE NCE)和信息噪声对比估计( I n f o N C E InfoNCE InfoNCE)是三个紧密相关…

CE、NCE、InfoNCE的演变过程及数学推导和关系

在机器学习和深度学习中,交叉熵( C E CE CE)、噪声对比估计( N C E NCE NCE)和信息噪声对比估计( I n f o N C E InfoNCE InfoNCE)是三个紧密相关的损失函数,逐步演变以解决不同场景下的问题。以下是它们的演变过程、数学推导及关系分析。


1. 交叉熵(Cross-Entropy, CE)

背景

C E CE CE是分类任务的基础损失函数,衡量模型预测分布 q q q与真实分布 p p p的差异。

数学形式

对于真实标签的独热编码分布 p p p和模型预测分布 q q q,交叉熵定义为:
CE ( p , q ) = − ∑ i p i log ⁡ q i \text{CE}(p, q) = -\sum_{i} p_i \log q_i CE(p,q)=ipilogqi

在分类任务中( p p p是单点分布),简化为:
CE = − log ⁡ q y \text{CE} = -\log q_y CE=logqy
其中 q y q_y qy是模型对真实类别 y y y的预测概率。

应用

用于监督学习,直接优化模型输出与标签的匹配度。


2. 噪声对比估计(Noise-Contrastive Estimation, NCE)

背景

当模型输出未归一化(如语言模型中的logits)时,计算softmax的分母(配分函数)代价高昂。 N C E NCE NCE通过将概率密度估计转化为二分类问题,避免显式计算归一化项。

核心思想

  • 将真实数据样本(分布 p d ( x ) p_d(x) pd(x))与噪声样本(分布 p n ( x ) p_n(x) pn(x))对比
  • 模型学习密度比 p d ( x ) p n ( x ) \frac{p_d(x)}{p_n(x)} pn(x)pd(x)

数学推导

定义样本来自数据分布的概率:
p ( data = 1 ∣ x ) = p d ( x ) p d ( x ) + k p n ( x ) p(\text{data}=1 | x) = \frac{p_d(x)}{p_d(x) + k p_n(x)} p(data=1∣x)=pd(x)+kpn(x)pd(x)
其中 k k k是噪声样本比例。损失函数为二元交叉熵:
L NCE = − E x ∼ p d [ log ⁡ p d ( x ) p d ( x ) + k p n ( x ) ] − k E x ∼ p n [ log ⁡ k p n ( x ) p d ( x ) + k p n ( x ) ] \mathcal{L}_{\text{NCE}} = -\mathbb{E}_{x \sim p_d} \left[ \log \frac{p_d(x)}{p_d(x) + k p_n(x)} \right] - k \mathbb{E}_{x \sim p_n} \left[ \log \frac{k p_n(x)}{p_d(x) + k p_n(x)} \right] LNCE=Expd[logpd(x)+kpn(x)pd(x)]kExpn[logpd(x)+kpn(x)kpn(x)]

应用

用于无监督学习(如语言模型),避免计算softmax分母。


3. 信息噪声对比估计(InfoNCE)

背景

在对比学习中,需要最大化同一数据不同视角的互信息 I ( q ; k + ) I(q; k^+) I(q;k+) I n f o N C E InfoNCE InfoNCE N C E NCE NCE扩展到多负样本场景。

核心思想

  • 对查询 q q q,构造正样本 k + k^+ k+和负样本 { k − } \{k^-\} {k}
  • 目标:最大化 exp ⁡ ( q ⋅ k + / τ ) ∑ exp ⁡ ( q ⋅ k / τ ) \frac{\exp(q \cdot k^+/ \tau)}{\sum \exp(q \cdot k/ \tau)} exp(qk/τ)exp(qk+/τ)

数学推导

损失函数形式:
L InfoNCE = − E [ log ⁡ exp ⁡ ( q ⋅ k + / τ ) exp ⁡ ( q ⋅ k + / τ ) + ∑ k − exp ⁡ ( q ⋅ k − / τ ) ] \mathcal{L}_{\text{InfoNCE}} = -\mathbb{E} \left[ \log \frac{\exp(q \cdot k^+ / \tau)}{\exp(q \cdot k^+ / \tau) + \sum_{k^-} \exp(q \cdot k^- / \tau)} \right] LInfoNCE=E[logexp(qk+/τ)+kexp(qk/τ)exp(qk+/τ)]
其中 τ \tau τ是温度系数。

理论意义

I n f o N C E InfoNCE InfoNCE是互信息的下界:
I ( q ; k + ) ≥ log ⁡ N − L InfoNCE I(q; k^+) \geq \log N - \mathcal{L}_{\text{InfoNCE}} I(q;k+)logNLInfoNCE
N N N为负样本数+1。


三者关系总结

方法目标数学形式关键改进
C E CE CE监督分类 − log ⁡ exp ⁡ ( s y ) ∑ i exp ⁡ ( s i ) -\log \frac{\exp(s_y)}{\sum_{i} \exp(s_i)} logiexp(si)exp(sy)直接概率匹配
N C E NCE NCE无监督密度估计 − log ⁡ p d ( x ) p d ( x ) + k p n ( x ) − k log ⁡ k p n ( x ) p d ( x ) + k p n ( x ) -\log \frac{p_d(x)}{p_d(x)+k p_n(x)} - k \log \frac{k p_n(x)}{p_d(x)+k p_n(x)} logpd(x)+kpn(x)pd(x)klogpd(x)+kpn(x)kpn(x)二分类替代配分函数计算
I n f o N C E InfoNCE InfoNCE对比学习/互信息最大化 − log ⁡ exp ⁡ ( q ⋅ k + / τ ) ∑ exp ⁡ ( q ⋅ k / τ ) -\log \frac{\exp(q \cdot k^+/ \tau)}{\sum \exp(q \cdot k/ \tau)} logexp(qk/τ)exp(qk+/τ)多负样本扩展

演变逻辑

  1. C E CE CE N C E NCE NCE的演进
    针对高维输出空间中softmax归一化分母计算复杂度 O ( ∣ V ∣ ) O(|V|) O(V)过高的问题(其中 ∣ V ∣ |V| V为类别数), N C E NCE NCE通过引入噪声对比的范式转变,将原始的多类概率估计问题重构为判别二分类问题。具体而言:

    • 构建噪声分布 p n ( x ) p_n(x) pn(x)与数据分布 p d ( x ) p_d(x) pd(x)的对抗框架
    • 通过调节噪声样本比例 k k k控制计算复杂度,实现计算效率从 O ( ∣ V ∣ ) O(|V|) O(V) O ( k ) O(k) O(k)的优化
    • 保持概率密度比 p d ( x ) p n ( x ) \frac{p_d(x)}{p_n(x)} pn(x)pd(x)的渐进一致性
  2. N C E NCE NCE I n f o N C E InfoNCE InfoNCE的演进
    基于表示学习的需求, I n f o N C E InfoNCE InfoNCE N C E NCE NCE的基础上进行了三个关键改进:

    • 样本构造:从显式噪声分布采样转为隐式负样本挖掘( N − 1 N-1 N1个负例)
    • 目标函数:从二元logistic损失扩展为基于温度系数 τ \tau τ的多类softmax交叉熵
    • 理论保障:建立与互信息 I ( q ; k + ) I(q;k^+) I(q;k+)的显式关联,满足 lim ⁡ N → ∞ I ( q ; k + ) ≥ log ⁡ N − L InfoNCE \lim_{N \to \infty} I(q;k^+) \geq \log N - \mathcal{L}_{\text{InfoNCE}} limNI(q;k+)logNLInfoNCE

总结

  • C E CE CE:监督学习的基础损失
  • N C E NCE NCE:通过噪声对比避免配分函数计算
  • I n f o N C E InfoNCE InfoNCE:成为对比学习的核心损失函数

三者的演变体现了从直接概率匹配到隐式表示学习的范式转变,核心是通过设计更高效的损失函数解决实际计算难题。

http://www.dtcms.com/wzjs/789977.html

相关文章:

  • 企业网站首页应如何布局wordpress+首页置顶
  • 做儿童成长相册模版网站做商演任务的网站
  • 响应式网站设计欣赏桂林市临桂区
  • 苏州营销型网站制作公司培训管理网站建设
  • 怎么看网站开发的技术wordpress横线
  • 帝国做的网站打开速度做58同城这样的网站
  • 大连购物网站开发工程中心网站建设汇报
  • 企业网站搭建步骤湖北哪里需要建网站
  • 网页制作培训网站天津网站建设培训班
  • 太阳能公司网站建设推荐做网站的公司
  • 哈尔滨网站建设推广服务如何做监控网站
  • 做羞羞事的网站有哪些盐田区网站建设
  • 怎样推广网站买了网站主机后如何建设网站
  • 切管机维修 东莞网站建设郑州企业网络推广外包
  • 厦门网站建设哪家不错推荐小程序价格多少钱
  • 企业网站每天更新更改文章标题字体wordpress
  • 一个公司的网站怎么做阿里云搭建个人博客wordpress
  • 浙江网站建设培训机构成都免费建站模板
  • 美食网站首页扬州市住房和建设局网站
  • 做铝材什么什么网站好企业网站开发需求
  • 南皮做网站乡村旅游网站的建设分析
  • 百度网站怎么做企业网站策划案
  • 网站开发技术案例我的世界寻找建筑网站
  • 营销型网站建设公司哪家好php网站案例
  • 借个网站备案号网站搭建团队
  • 济南网站制作运营高端建站网站
  • 天津河北做网站的公司国外网站icp备案
  • a做爰网站怎么区分模板网站
  • 个人备案网站可以做论坛吗浙江网站建设 seo
  • 做外贸的 需要什么样的网站虚拟机中建设iis网站