减少采样空间方法 变成后验概率
又 因为后验概率很难计算 --所以通过引入变分分布来近似 后验概率分布
同时 引入 kl散度来度量 近似的效果好不好
什么是kl散度
kl散度带变分:
第一个问题 :积分变期望
问题二:贝叶斯公式
第三个问题:为啥可以独立出来 因为相比是常数 所以可以提取出来
为啥可以把 最大化对数似然转化为最大化ELBO 因为 我们希望lnpx最大化就是 最小化
又 因为后验概率很难计算 --所以通过引入变分分布来近似 后验概率分布
同时 引入 kl散度来度量 近似的效果好不好
什么是kl散度
kl散度带变分:
第一个问题 :积分变期望
问题二:贝叶斯公式
第三个问题:为啥可以独立出来 因为相比是常数 所以可以提取出来
为啥可以把 最大化对数似然转化为最大化ELBO 因为 我们希望lnpx最大化就是 最小化