当前位置：首页 > news >正文

机器学习：贝叶斯派

news 2025/8/26 6:35:59

贝叶斯派认为 $p (x ∣ θ)$ 中 $θ$ 不是一个常量。这个 $θ$ 满足一个预设的先验的分布 $θ∼p(θ)θ\sim p(θ)$ 。于是根据贝叶斯定理依赖观测集参数的后验可以写成：
$\frac{ p(X|θ) \cdot p(θ)}{p(x)} = \frac{p(X|θ) \cdot p(θ)}{\int\limits_θp(X|θ) \cdot p(θ) dθ}$
这里的解释：

参数 $θ\theta$ 视为随机变量，他有自己的先验分布 $p(θ)p(\theta)$ 。当我们要计算观测数据 $X$ 出现的 “绝对概率$ p(X)$ 时，需要考虑参数 $θ\theta$ 所有可能取值对 $p (X)$ 的贡献。根据全概率公式，对于连续型随机变量 $θ\theta$ ，观测数据 $X$ 的边缘概率（也叫证据） $p (X)$ ，需要对在给定的 $θ\theta$ 条件下 $X$ 发生的概率 $p(X∣θ)p(X|\theta)$ ，乘以 $θ\theta$ 自身的先验概率密度 $p(θ)p(\theta)$ ，然后对 $θ\theta$ 所有的可能取值范围进行积分即：
$\frac{p(X|θ) \cdot p(θ)}{\int\limits_θp(X|θ) \cdot p(θ) dθ}$

为了求 $θ\theta$ 的值，我们要最大化这个参数后验MAP：
$\theta_{MAP} = \underset{\theta}{\arg\max} \space p(\theta \mid X) = \underset{\theta}{\arg\max} \space p(X \mid \theta) \cdot p(\theta)$
其中第二个等号由于和 $θ\theta$ 没有关系。求解这个 $θ\theta$ 值后计算
$p(X∣θ)⋅p(θ)∫θp(X∣θ)⋅p(θ)dθ\frac{p(X|θ) \cdot p(θ)}{\int\limits_θp(X|θ) \cdot p(θ) dθ}$

，就得到了参数的后验概率。其中 $p(X∣θp(X|\theta$ 叫似然，是我们的模型分布。得到了参数的后验分布后，我们可以将这个分布用于预测贝叶斯预测：
$p(x_{new}|X) = \int\limits_{\theta} \space p(x_{new} | \theta) \cdot p(\theta| X))d\theta$
其中积分中的被乘数是模型，乘数是后验分布。