当前位置: 首页 > wzjs >正文

网站开发设计素材大连做网站制作

网站开发设计素材,大连做网站制作,广州网站建设gzzhixun,wordpress 360字体掩码图像建模 (MIM) 中的对数似然与交叉熵 1. 问题背景 在掩码图像建模(MIM)任务中,模型需要预测被遮蔽的图像块对应的视觉词元(可以理解为图像块的离散类别标签)。 具体来说: 每个被遮蔽的图像块 i ∈…

掩码图像建模 (MIM) 中的对数似然与交叉熵

1. 问题背景

在掩码图像建模(MIM)任务中,模型需要预测被遮蔽的图像块对应的视觉词元(可以理解为图像块的离散类别标签)。

具体来说:

  • 每个被遮蔽的图像块 i ∈ M i \in M iM 的真实标签是 z i z_i zi(即它原本的视觉词元类别)。
  • 模型通过 Transformer 编码器生成隐藏向量 h L i h_L^i hLi,然后通过一个分类器(参数为 W c , b c W_c, b_c Wc,bc)预测该位置的概率分布 p MIM ( z ′ ∣ x M ) p_{\text{MIM}}(z' | x^M) pMIM(zxM)

2. Softmax 分类器的作用

分类器的公式是:
p MIM ( z ′ ∣ x M ) = softmax z ( W c h L i + b c ) p_{\text{MIM}}(z' | x^M) = \text{softmax}_z(W_c h_L^i + b_c) pMIM(zxM)=softmaxz(WchLi+bc)

  • 输入:隐藏向量 h L i ∈ R D h_L^i \in \mathbb{R}^D hLiRD(来自 Transformer 的输出)。
  • 参数:权重矩阵 W c ∈ R ∣ V ∣ × D W_c \in \mathbb{R}^{|\mathcal{V}| \times D} WcRV×D 和偏置 b c ∈ R ∣ V ∣ b_c \in \mathbb{R}^{|\mathcal{V}|} bcRV,其中 ∣ V ∣ |\mathcal{V}| V 是视觉词元的总类别数。
  • 输出:一个概率分布,表示模型认为被遮蔽块 i i i 属于每个视觉词元类别的概率。

具体计算步骤

  1. 对每个被遮蔽位置 i i i,计算线性变换: W c h L i + b c W_c h_L^i + b_c WchLi+bc,得到一个长度为 ∣ V ∣ |\mathcal{V}| V 的向量(称为logits)。
  2. 对 logits 应用 softmax 函数,将其转换为概率分布:
    p ( z ′ ) = exp ⁡ ( logits [ z ′ ] ) ∑ k = 1 ∣ V ∣ exp ⁡ ( logits [ k ] ) p(z') = \frac{\exp(\text{logits}[z'])}{\sum_{k=1}^{|\mathcal{V}|} \exp(\text{logits}[k])} p(z)=k=1Vexp(logits[k])exp(logits[z])
    其中 z ′ z' z 是某个可能的视觉词元类别。

3. 最大化对数似然(Maximize Log-Likelihood)

目标:让模型对真实标签 z i z_i zi 的预测概率尽可能高。

数学表达:
max ⁡ θ E x ∼ D [ ∑ i ∈ M log ⁡ p MIM ( z i ∣ x M ) ] \max_{\theta} \mathbb{E}_{x \sim \mathcal{D}} \left[ \sum_{i \in M} \log p_{\text{MIM}}(z_i | x^M) \right] θmaxExD[iMlogpMIM(zixM)]

  • 解释
    • 对每个被遮蔽位置 i i i,计算真实标签 z i z_i zi 的对数概率 log ⁡ p MIM ( z i ∣ x M ) \log p_{\text{MIM}}(z_i | x^M) logpMIM(zixM)
    • 对所有被遮蔽位置求和,再对所有训练样本 x x x 求期望。
    • 目标是最大化这个总和,即让模型对真实标签的预测概率尽可能大。

4. 交叉熵损失(Cross-Entropy Loss)

交叉熵损失是分类任务中常用的损失函数,定义为:
L CE = − ∑ i ∈ M log ⁡ p MIM ( z i ∣ x M ) \mathcal{L}_{\text{CE}} = - \sum_{i \in M} \log p_{\text{MIM}}(z_i | x^M) LCE=iMlogpMIM(zixM)

  • 解释
    • 对每个被遮蔽位置 i i i,计算真实标签 z i z_i zi 的负对数概率。
    • 对所有被遮蔽位置求和,得到总损失。
    • 目标是最小化这个损失,即让真实标签的预测概率尽可能高。

5. 最大化对数似然 vs. 最小化交叉熵

关键结论
最大化对数似然最小化交叉熵损失完全等价的!

具体来说:
max ⁡ θ ∑ i ∈ M log ⁡ p MIM ( z i ∣ x M ) ⟺ min ⁡ θ ( − ∑ i ∈ M log ⁡ p MIM ( z i ∣ x M ) ) \max_{\theta} \sum_{i \in M} \log p_{\text{MIM}}(z_i | x^M) \quad \iff \quad \min_{\theta} \left( - \sum_{i \in M} \log p_{\text{MIM}}(z_i | x^M) \right) θmaxiMlogpMIM(zixM)θmin(iMlogpMIM(zixM))

  • 左边是最大化对数似然(使正确标签的概率最大化)。
  • 右边是最小化交叉熵损失(使正确标签的负对数概率最小化)。

6. 为什么等价?

  • 数学本质:交叉熵损失是负的对数似然。
    • 对数似然是 ∑ log ⁡ p \sum \log p logp,交叉熵是 − ∑ log ⁡ p -\sum \log p logp
    • 最大化 A A A 等价于最小化 − A -A A
  • 直观理解
    • 如果模型对真实标签的预测概率 p ( z i ) p(z_i) p(zi) 越大,对数似然 log ⁡ p ( z i ) \log p(z_i) logp(zi) 越大,交叉熵损失 − log ⁡ p ( z i ) -\log p(z_i) logp(zi) 越小。
    • 例如,若真实标签的概率 p ( z i ) = 0.9 p(z_i) = 0.9 p(zi)=0.9,则交叉熵损失为 − log ⁡ ( 0.9 ) ≈ 0.11 -\log(0.9) \approx 0.11 log(0.9)0.11
      若概率 p ( z i ) = 0.1 p(z_i) = 0.1 p(zi)=0.1,则损失为 − log ⁡ ( 0.1 ) ≈ 2.30 -\log(0.1) \approx 2.30 log(0.1)2.30
      显然,概率越大,损失越小。

7. 实际训练中的计算

在代码中,通常直接使用交叉熵损失函数(如 PyTorch 的 CrossEntropyLoss):

# 假设 logits 是模型的输出(未经过 softmax)
# targets 是被遮蔽位置的真实视觉词元标签
loss = F.cross_entropy(logits, targets)
  • 内部过程
    1. 对 logits 应用 softmax,得到概率分布。
    2. 计算真实标签的负对数概率。
    3. 对所有样本和位置求平均,得到最终损失。

总结

  • 目标:让模型对真实标签的预测概率尽可能高。
  • 数学实现:通过最大化对数似然(等价于最小化交叉熵损失)。
  • 代码实现:直接使用交叉熵损失函数,无需手动计算对数似然。
http://www.dtcms.com/wzjs/592455.html

相关文章:

  • 正式做网站站点怎么新建网络营销的推广方式都有哪些
  • 做网站所需要的代码网站流量 盈利
  • 网站整站开发机械设备网
  • 北京石景山网站建设价格低用什么词形容
  • 免费奖励自己的网站广州做网站价格
  • 网站建设项目总结商品网站做推广方案
  • 保定集团网站建设网站建设中如何使用字体
  • 做网站建设需要会哪些在线制作网站乔拓云
  • 网站建设模板怎么用南宁网络推广公司哪家好
  • 安徽建设学校官方网站wordpress 阿里云存储
  • 合肥制作手机网站百度搜索关键词排名人工优化
  • 深圳西丽网站建设developer官网下载
  • 网站的下拉列表怎么做的织梦手机网站建设
  • cnzz网站建设WordPress仿百度贴吧主题
  • 自己建个电影网站可以吗网站主题怎么介绍
  • 网站简历模板17做网店这个网站好不好
  • 网站建设优化方案网站站内推广计划书
  • 自己做的网页可以上传网站吗怎么开通个人微信公众号
  • WordPress站群模版网络宣传策划方案模板
  • 网站功能板块优书网怎么了
  • 子商务网站建设的一般流程图ccd深圳设计公司
  • 网站投稿源码wix网站做seo如何
  • 深圳网站建设是什么五金技术支持东莞网站建设
  • 电脑做系统教学网站网站建设制作浩森宇特
  • 鲁山网站建设兼职公司网站开发找哪家
  • 万网做网站怎么样第一接单网
  • 郑州做网站kuihuakeji外链下载
  • 有那个网站做外贸初中生怎么升大专学历
  • 深圳市住房建设局网站百度为什么不收录网站的某个版块
  • 外省住房和城乡建设厅网站英文网站建设公司 杭州