当前位置: 首页 > news >正文

Beta分布--贝叶斯建模概率或比例常用分布

Beta分布是一种定义在区间 ([0, 1]) 上的连续概率分布,常用于描述比例或概率的不确定性。它的形状由两个正参数 (\alpha)(alpha)和 (\beta)(beta)控制,能够呈现多种形态(如对称、偏态、U型等)。


1. 概率密度函数(PDF)

Beta分布的概率密度函数为:
f ( x ; α , β ) = x α − 1 ( 1 − x ) β − 1 B ( α , β ) , x ∈ [ 0 , 1 ] f(x; \alpha, \beta) = \frac{x^{\alpha-1}(1-x)^{\beta-1}}{B(\alpha, \beta)}, \quad x \in [0, 1] f(x;α,β)=B(α,β)xα1(1x)β1,x[0,1]
其中:

  • (B(\alpha, \beta)) 是Beta函数,用于归一化:
    B ( α , β ) = ∫ 0 1 t α − 1 ( 1 − t ) β − 1 d t = Γ ( α ) Γ ( β ) Γ ( α + β ) B(\alpha, \beta) = \int_0^1 t^{\alpha-1}(1-t)^{\beta-1} dt = \frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha + \beta)} B(α,β)=01tα1(1t)β1dt=Γ(α+β)Γ(α)Γ(β)
  • (\Gamma(\cdot)) 是伽马函数(Gamma function),满足 (\Gamma(n) = (n-1)!) 对正整数 (n)。

2. 分布的形状

Beta分布的形状由 (\alpha) 和 (\beta) 决定:

  • 对称分布:当 (\alpha = \beta) 时,分布对称(如 (\alpha=\beta=1) 时为均匀分布;(\alpha=\beta=2) 时为钟形)。
  • 偏态分布
    • (\alpha > \beta):左偏(峰值靠近1)。
    • (\alpha < \beta):右偏(峰值靠近0)。
  • 极端形态
    • (\alpha, \beta < 1):U型(集中在0和1附近)。
    • (\alpha = 1, \beta > 1):递减。
    • (\beta = 1, \alpha > 1):递增。
典型例子
参数 ((\alpha, \beta))形状描述示例场景
((1, 1))均匀分布(Flat)无先验信息时假设。
((2, 2))对称钟形(峰值在0.5)硬币公平性的温和先验。
((5, 1))极端右偏(峰值靠近1)成功概率很高的场景。
((0.5, 0.5))U型(双峰在0和1)两极分化强烈的比例(如点击率)。

3. 可视化示例

下图展示了不同参数组合下的Beta分布形状:
在这里插入图片描述

  • 红色曲线:((0.5, 0.5)) → U型。
  • 蓝色曲线:((5, 1)) → 左偏。
  • 绿色曲线:((2, 5)) → 右偏。
  • 黑色曲线:((1, 1)) → 均匀分布。

4. 统计性质

  • 期望(均值)
    E [ X ] = α α + β E[X] = \frac{\alpha}{\alpha + \beta} E[X]=α+βα
  • 方差
    Var ( X ) = α β ( α + β ) 2 ( α + β + 1 ) \text{Var}(X) = \frac{\alpha \beta}{(\alpha + \beta)^2 (\alpha + \beta + 1)} Var(X)=(α+β)2(α+β+1)αβ
  • 众数(峰值点)(当 (\alpha, \beta > 1)):
    Mode = α − 1 α + β − 2 \text{Mode} = \frac{\alpha - 1}{\alpha + \beta - 2} Mode=α+β2α1

5. 应用场景

Beta分布常用于:

  1. 贝叶斯统计:作为二项分布参数的共轭先验(如点击率、转化率)。
  2. A/B测试:建模两个版本的胜率。
  3. 概率建模:描述任何有界区间(如用户评分、完成率)。

6. 与其他分布的关系

  • 二项分布:Beta分布是二项分布参数 (p) 的共轭先验。
  • 均匀分布:当 (\alpha = \beta = 1) 时,Beta分布退化为均匀分布。

总结

Beta分布是一个灵活的概率分布,通过调整 (\alpha) 和 (\beta) 可以模拟从均匀分布到极端偏态的各种形态,特别适合建模比例或概率的不确定性。其数学性质良好,是贝叶斯分析中的核心工具之一。

相关文章:

  • 游戏逆向开发全阶段电子资料分享 – 从入门到精通实战教程
  • C语言和Python在负数取余运算(%)上的差异
  • AUTOSAR图解==>AUTOSAR_TR_InteractionWithBehavioralModels
  • C++基本知识 —— 缺省参数·函数重载·引用
  • 2025年PMP 学习八 -第6章 项目进度管理
  • 方案精读:华为与中软-智慧园区解决方案技术主打胶片【附全文阅读】
  • 张量并行优质博客
  • AQS(AbstractQueuedSynchronizer)解析
  • Python模块与包以及工程文件管理
  • arctan x 导数推理
  • Spring Cloud : OpenFeign(远程调用)
  • LoRA(Low-Rank Adaptation)原理详解
  • 微服务架构-限流、熔断:Alibaba Sentinel入门
  • 【英语笔记(四)】诠释所有16种英语时态,介绍每种时态下的动词变形!!含有所有时态的的动词变形汇总表格
  • mybatis执行sql过程
  • MySQL用户管理
  • 解锁c++模板:从入门到精通
  • 二叉树三大遍历-精髓(Java)
  • Python 对象引用、可变性和垃圾 回收(标识、相等性和别名)
  • 酒店等场所客房沐浴用品批发要点:满足多样需求,把握关键环节
  • 朝着解决问题的正确方向迈进——中美经贸高层会谈牵动世界目光
  • 哈佛新论文揭示 Transformer 模型与人脑“同步纠结”全过程!AI也会犹豫、反悔?
  • 李公明 | 一周画记:印巴交火会否升级为第四次印巴战争?
  • 央行:当前我国债券市场定价效率、机构债券投资交易和风险管理能力仍有待提升
  • “浦东时刻”在京展出:沉浸式体验海派风情
  • 数理+AI+工程,上海交大将开首届“笛卡尔班”招生约20名