当前位置：首页 > news >正文

扩散模型的数学基础 —— 贝叶斯

news 2025/7/15 6:31:26

贝叶斯定理基础
贝叶斯定理在条件扩散模型中的应用
- 利用贝叶斯定理分解
- - 第一项：无条件得分项（prior score）
  - 第二项：条件得分项（guidance term）
- 分类器引导（Classifier Guidance）
- DPS（Diffusion Posterior Sampling）
- 重建引导（Reconstruction Guidance）
总结：贝叶斯得分引导公式的作用

贝叶斯定理基础

给定两个事件 $A$ 和 $B$ ，条件概率定义为：

$\mid B) = \frac{P(A \cap B)}{P(B)}, \quad P(B \mid A) = \frac{P(A \cap B)}{P(A)}$

由此得：

$\cap B) = P(A \mid B) P(B) = P(B \mid A) P(A)$

移项得贝叶斯定理：

$P(A∣B)=P(B∣A)P(A)P(B)\boxed{P(A \mid B) = \frac{P(B \mid A) P(A)}{P(B)}}$

贝叶斯定理在条件扩散模型中的应用

在扩散模型中，设想我们希望生成满足某个条件 $y$ 的样本 $x_0$ 。我们研究的是在某一时刻 $t$ ，扩散模型下的 条件分布的梯度（得分）：

$∇xtlog⁡pt(xt∣y)\nabla_{x_t} \log p_t(x_t \mid y)$

这是生成满足条件 $y$ 的样本所需的梯度方向。

利用贝叶斯定理分解

对数形式的贝叶斯定理：

$log⁡pt(xt∣y)=log⁡pt(xt)+log⁡pt(y∣xt)−log⁡pt(y)\log p_t(x_t \mid y) = \log p_t(x_t) + \log p_t(y \mid x_t) - \log p_t(y)$

对 $x_t$ 求梯度时，注意 $log p_t(y)$ 与 $x_t$ 无关，因此它的梯度为 0：

$∇xtlog⁡pt(xt∣y)=∇xtlog⁡pt(xt)+∇xtlog⁡pt(y∣xt)\boxed{ \nabla_{x_t} \log p_t(x_t \mid y) = \nabla_{x_t} \log p_t(x_t) + \nabla_{x_t} \log p_t(y \mid x_t) }$

第一项：无条件得分项（prior score）

$∇xtlog⁡pt(xt)\nabla_{x_t} \log p_t(x_t)$

表示当前时刻 $x_t$ 下的 无条件得分函数；
通常由训练好的扩散模型（如噪声预测网络）直接提供；
是去噪方向的重要组成部分。

第二项：条件得分项（guidance term）

$∇xtlog⁡pt(y∣xt)\nabla_{x_t} \log p_t(y \mid x_t)$

是使生成样本满足条件 $y$ 的“引导项”；
可以使用不同策略近似或显式计算：

分类器引导（Classifier Guidance）

训练一个分类器 $Cϕ(xt)≈pt(y∣xt)C_\phi(x_t) \approx p_t(y \mid x_t)$
然后使用分类器对数输出的梯度作为引导：

$∇xtlog⁡pt(y∣xt)≈∇xtlog⁡Cϕ(xt)\nabla_{x_t} \log p_t(y \mid x_t) \approx \nabla_{x_t} \log C_\phi(x_t)$

DPS（Diffusion Posterior Sampling）

不需要配对数据训练分类器；
假设已知无噪声数据下的条件概率 $\mid x_0)$
使用扩散模型的 MMSE 估计 $x^t≈E[x0∣xt]\hat{x}_t \approx \mathbb{E}[x_0 \mid x_t]$
将梯度近似为：

$∇xtlog⁡pt(y∣xt)≈∇xtlog⁡p(y∣x^t)\boxed{ \nabla_{x_t} \log p_t(y \mid x_t) \approx \nabla_{x_t} \log p(y \mid \hat{x}_t) }$

只要 $\mid x_0)$ 对 $x_0$ 可微，这一项就对 $x_t$ 可导。

重建引导（Reconstruction Guidance）

DPS 的特例：假设 $\mid x_0)$ 为高斯分布，如：

$\mid x_0) = \mathcal{N}(y; x_0, \sigma^2 I)$

则：
$∇xtlog⁡pt(y∣xt)≈x^t−yσ2⋅∂x^t∂xt\nabla_{x_t} \log p_t(y \mid x_t) \approx \frac{\hat{x}_t - y}{\sigma^2} \cdot \frac{\partial \hat{x}_t}{\partial x_t}$

总结：贝叶斯得分引导公式的作用

最终，通过贝叶斯定理将 条件得分 分解为：

$∇xtlog⁡pt(xt∣y)=∇xtlog⁡pt(xt)⏟模型本身+∇xtlog⁡pt(y∣xt)⏟外部引导\nabla_{x_t} \log p_t(x_t \mid y) = \underbrace{\nabla_{x_t} \log p_t(x_t)}_{\text{模型本身}} + \underbrace{\nabla_{x_t} \log p_t(y \mid x_t)}_{\text{外部引导}}$