当前位置: 首页 > news >正文

【漫话机器学习系列】132.概率质量函数(Probability Mass Function, PMF)

概率质量函数(Probability Mass Function, PMF)详解

1. 概述

概率质量函数(PMF, Probability Mass Function)用于描述离散随机变量的概率分布。简单来说,它给出了随机变量取某个具体值的概率。PMF 适用于那些只能取有限个或可数无穷多个离散值的变量,例如抛硬币的结果(正面或反面)、掷骰子的点数(1-6)等。

2. 概率质量函数的数学定义

设 XXX 是一个离散随机变量,取值范围为 x_1, x_2, \dots, x_n,则概率质量函数定义如下:

P(X = x) = f(x)

其中:

  • P(X = x) 表示随机变量 X 取值为 x 的概率。
  • f(x) 代表该值的概率质量函数。

PMF 必须满足以下两个条件:

  1. 非负性:对于所有可能的 x,P(X = x) \geq 0
  2. 归一化性质(所有概率之和为 1):

    \sum_{x \in S} P(X = x) = 1

    其中 S 是随机变量 X 的所有可能取值集合。
3. 概率质量函数的直观解释

概率质量函数可以用柱状图条形图来表示。例如,在图片中,我们看到一个离散随机变量的概率分布,横轴是可能取值,纵轴是概率,用不同高度的柱子来表示每个取值的概率大小。

4. 例子
(1) 掷骰子的 PMF

假设掷一个公正的 6 面骰子,随机变量 X 表示掷出的点数。由于骰子是公正的,每个点数的概率相等,PMF 如下:

如果用柱状图表示,每个点数x(1 到 6)都会对应一个相等高度的柱子。

(2) 抛硬币的 PMF

设 X 为一次抛硬币时出现正面的次数,则:

这也是一个典型的离散概率分布。

5. PMF 与其他概率分布的关系
  • 概率密度函数(PDF, Probability Density Function):PMF 适用于离散随机变量,而 PDF 适用于连续随机变量。对于连续变量,例如人的身高或温度,我们不能用 PMF,而需要用概率密度函数。
  • 累积分布函数(CDF, Cumulative Distribution Function):PMF 只给出某个具体取值的概率,而 CDF 是从小到大累积概率,定义为:

    F(x) = P(X \leq x) = \sum_{t \leq x} P(X = t)

    CDF 适用于 PMF 和 PDF,但 PMF 直接给出每个取值的独立概率,而 CDF 累加这些概率。
6. PMF 的实际应用

概率质量函数在很多现实场景中都有重要作用:

  1. 机器学习和数据科学:离散数据建模,如分类问题、朴素贝叶斯分类器等。
  2. 金融建模:股票价格涨跌的离散状态概率。
  3. 质量控制:工厂产品的合格与不合格概率建模。
  4. 自然语言处理(NLP):分析单词在文本中的出现概率。
7. 结论

概率质量函数是描述离散随机变量概率分布的重要工具,广泛应用于统计学、数据科学、金融等领域。理解 PMF 有助于更深入地研究概率论,并在实际问题中构建有效的概率模型。


图示解析 在图片中:

  • 标题用中文和英文分别写出了“概率质量函数”(Probability Mass Function)。
  • 文字说明指出 PMF 是用于描述离散随机变量的概率分布。
  • 右侧的柱状图表示了某个离散随机变量的概率分布,其中每个可能取值对应一个概率高度。
  • 画面风格手绘,增强了可读性和直观理解。

希望这篇文章能帮助你全面理解概率质量函数(PMF)

相关文章:

  • 体验开源openeuler openharmony stratovirt模拟器
  • Linux内核实时机制18 - RT调度器1 - 数据结构
  • hive开窗函数
  • JavaScript性能优化实战
  • 第四十五篇-Tesla P40关闭GPU的ECC释放部分显存
  • 刷leetcode hot100--动态规划3.11
  • 指针的比较
  • MQTT 物联网的首先协议
  • 小程序 wxml 语法 —— 36 wxml 语法 - setData() 修改数据
  • 基于协同过滤算法的音乐推荐系统(源码+部署教程)
  • 【华三(H3C)交换机上修改 NTP 配置】
  • Docker安装Kafka(内含zookeeper)
  • 第二章:盒模型的奥秘
  • 每天一道算法题【蓝桥杯】【使用最小花费爬楼梯】
  • 扩散 Transformer 策略:用于通才视觉-语言-动作学习的规模化扩散 Transformer
  • 51c大模型~合集10
  • 《使用 Python Flask + MySQL + ECharts 构建销售数据看板》实战案例笔记
  • osg安装编译第三方,完整详细过程。 libtiff/tif config.vc.hdoes not exist
  • GStreamer —— 2.17、Windows下Qt加载GStreamer库后运行 - “播放教程 5:色彩平衡“(附:完整源码)
  • 基于Debian12的SVN和Trac自动安装部署脚本
  • 比尔·盖茨:未来20年通过盖茨基金会捐出几乎全部财富,2045年底基金会停止运营
  • 正荣地产:前4个月销售14.96亿元,控股股东已获委任联合清盘人
  • 中消协点名新能源汽车行业:定金退款争议频发
  • 中国驻美国大使馆发言人就中美经贸高层会谈答记者问
  • 美联储宣布维持基准利率不变
  • 金球看淡,不服就干!这是抬不起腿却昂着头的劳塔罗