当前位置: 首页 > news >正文

机器学习:贝叶斯派

贝叶斯派认为p(x∣θ)p(x|θ)p(xθ)θθθ不是一个常量。这个θθθ满足一个预设的先验的分布 θ∼p(θ)θ\sim p(θ)θp(θ)。于是根据贝叶斯定理依赖观测集参数的后验可以写成:
p(θ∣X)=p(X∣θ)⋅p(θ)p(x)=p(X∣θ)⋅p(θ)∫θp(X∣θ)⋅p(θ)dθ p(θ|X)= \frac{ p(X|θ) \cdot p(θ)}{p(x)} = \frac{p(X|θ) \cdot p(θ)}{\int\limits_θp(X|θ) \cdot p(θ) dθ} p(θX)=p(x)p(Xθ)p(θ)=θp(Xθ)p(θ)dθp(Xθ)p(θ)
这里的解释:

参数θ\thetaθ 视为随机变量,他有自己的先验分布p(θ)p(\theta)p(θ)。当我们要计算观测数据 XXX 出现的 “绝对概率$ p(X)$ 时,需要考虑参数 θ\thetaθ 所有可能取值对 p(X)p(X)p(X) 的贡献 。根据全概率公式,对于连续型随机变量θ\thetaθ ,观测数据XXX的边缘概率(也叫证据)p(X)p(X)p(X) ,需要对在给定的θ\thetaθ 条件下XXX 发生的概率p(X∣θ)p(X|\theta)p(Xθ) ,乘以θ\thetaθ 自身的先验概率密度p(θ)p(\theta)p(θ),然后对θ\thetaθ​所有的可能取值范围进行积分即:
p(X∣θ)⋅p(θ)∫θp(X∣θ)⋅p(θ)dθ \frac{p(X|θ) \cdot p(θ)}{\int\limits_θp(X|θ) \cdot p(θ) dθ} θp(Xθ)p(θ)dθp(Xθ)p(θ)

为了求 θ\thetaθ的值,我们要最大化这个参数后验MAP:
θMAP=arg⁡max⁡θ p(θ∣X)=arg⁡max⁡θ p(X∣θ)⋅p(θ) \theta_{MAP} = \underset{\theta}{\arg\max} \space p(\theta \mid X) = \underset{\theta}{\arg\max} \space p(X \mid \theta) \cdot p(\theta) θMAP=θargmax p(θX)=θargmax p(Xθ)p(θ)
其中第二个等号由于和θ\thetaθ 没有关系。求解这个θ\thetaθ值后计算
p(X∣θ)⋅p(θ)∫θp(X∣θ)⋅p(θ)dθ\frac{p(X|θ) \cdot p(θ)}{\int\limits_θp(X|θ) \cdot p(θ) dθ} θp(Xθ)p(θ)dθp(Xθ)p(θ)

,就得到了参数的后验概率。其中p(X∣θp(X|\thetap(Xθ 叫似然,是我们的模型分布。得到了参数的后验分布后,我们可以将这个分布用于预测贝叶斯预测:
p(xnew∣X)=∫θ p(xnew∣θ)⋅p(θ∣X))dθ p(x_{new}|X) = \int\limits_{\theta} \space p(x_{new} | \theta) \cdot p(\theta| X))d\theta p(xnewX)=θ p(xnewθ)p(θX))dθ
其中积分中的被乘数是模型,乘数是后验分布。

http://www.dtcms.com/a/349566.html

相关文章:

  • 【Linux | 网络】多路转接IO之poll
  • 编写Linux下usb设备驱动方法:usb设备驱动实现流程
  • AI-调查研究-60-机器人 机械臂技术发展趋势详解:工业、服务与DIY三大阵营全解析
  • rabbitmq集群
  • 基于RFM模型的客户群体大数据分析及用户聚类系统的设计与实现
  • AI+数据库:国内DBA职业发展与国产化转型实践
  • Torch入门小知识点--总结性语言
  • CSS基础学习第一天
  • The Google File System 详解
  • 【Docker基础】Docker-compose进阶配置:健康检查与服务就绪
  • 一、添加Viewport3DX,并设置相机、灯光
  • Java-包装类
  • 深度学习-----《PyTorch神经网络高效训练与测试:优化器对比、激活函数优化及实战技巧》
  • 【数据结构】栈和队列——队列
  • 向量库Qdrant vs Milvus 系统详细对比
  • 线性回归入门:从原理到实战的完整指南
  • 数据结构——线性表(链表,力扣中等篇,技巧型)
  • Postman 模拟mcp tool调用过程
  • 【数据结构】顺序表详解
  • Flink hop window(滑动窗口)详解
  • leetcode 498. 对角线遍历 中等
  • Linux下的软件编程——网络编程(http)
  • C++14 到 C++20 全面解析:语言新特性、标准库演进与实战案例
  • 【二叉树 - LeetCode】617. 合并二叉树
  • [QMT量化交易小白入门]-八十三、8月因为通信行业,QMT平台ETF轮动策略年化达到了168.56%
  • 降本增效:基于 JavaScript 的 AI 编程 IDE 上下文压缩优化方案
  • CloudBase云开发MCP + CodeBuddy IDE:打造智能化全栈理财助手的完整实践
  • 本地生活新风口:“我店模式”入局正当时??
  • Web程序设计
  • 【前端安全】前端安全第一课:防止 XSS 和 CSRF 攻击的常见手法