当前位置: 首页 > news >正文

以表格形式,图像形式,函数形式来理解 概率质量函数(Probability Mass Function, PMF)

以表格形式,图像形式,函数形式来理解 概率质量函数(Probability Mass Function, PMF)

flyfish

不想看过程直接看文末

有图有代码

首先,我们需要理解什么是“概率”。概率是用来衡量事件发生可能性的一个数字。它总是介于0和1之间:0意味着不可能发生,1意味着一定发生,0.5意味着一半一半的几率。比如,抛一枚公平硬币,正面朝上的概率是0.5。

在现实中,很多事情都是随机的,比如掷骰子、抽奖、天气预报。这些随机现象可以用“随机变量”来描述。随机变量就是一个变量,它的取值是随机的,但有一定的规律。我们把随机变量分成两种:离散型和连续型。这两种类型对应了PMF和PDF。

我们先从离散随机变量开始,因为它更简单、更直观,然后再过渡到连续随机变量。整个讲解会分成几个部分:基础概念、定义、例子、属性、比较,最后是应用。每个部分都会细致解释。

一、离散随机变量的基础

什么是离散随机变量?

想象一下,你在掷一个六面骰子。骰子的点数可能取值是1、2、3、4、5、6。这些取值是有限的、可以数清楚的,而且它们是“跳跃”的(比如没有1.5这样的值)。这种随机变量就叫离散随机变量(Discrete Random Variable)。离散的意思是“分散的、不连续的”。

更正式地说,离散随机变量的可能取值是一个有限集合,或者是一个可数无限集合(比如自然数1,2,3,…)。但在大多数实际问题中,都是有限的。

为什么叫“随机变量”?因为它的值不是固定的,而是随机的。但它不是完全乱的——每个取值都有一个概率。

如何描述离散随机变量的分布?

要描述一个离散随机变量,我们需要知道每个可能取值发生的概率。这就是概率分布(Probability Distribution)的概念。概率分布告诉我们:随机变量X取某个值x的概率是多少,用P(X = x)表示。

比如,对于骰子:
P(X=1) = 1/6
P(X=2) = 1/6

P(X=6) = 1/6

所有这些概率加起来必须等于1,因为总有一个结果会发生(骰子总会停下来)。

现在,我们引入概率质量函数(PMF)。PMF就是一种函数,它把每个可能取值x映射到它的概率P(X=x)。简单说,PMF是概率分布的“函数形式”。

二、概率质量函数(PMF)的形式

形式1:表格形式——“取值-概率”对应表

列出所有可能取值及其对应概率”

表格的标准结构

概率分布表由两列组成:
第一列(通常为“X”):离散随机变量的所有可能取值(必须完整,不能遗漏;取值需互斥,即一个结果只能对应一个取值);
第二列(通常为“P(X=x)”):对应取值的概率(需满足非负性和归一性)。

实例1:抛两次公平硬币(基础案例)

设随机变量X为“抛两次硬币的正面次数”,其概率分布表如下:

随机变量X(正面次数)对应事件(两次抛硬币的结果)概率P(X=x)计算逻辑(公平硬币,每次正面概率=0.5)
0(反,反)1/4 = 0.251种结果,概率=0.5×0.5=0.25
1(正,反)、(反,正)2/4 = 0.52种结果,概率=2×0.5×0.5=0.5
2(正,正)1/4 = 0.251种结果,概率=0.5×0.5=0.25
合计——1.0所有概率之和必须为1(验证分布合法性)

一眼能看出“X=1时概率最高(0.5),X=0和X=2时概率相等(0.25)”,直接求和最后一行,若为1则是合法分布。

实例2:不公平硬币(体现非均匀分布)

设硬币正面概率=0.7,反面=0.3,抛两次后X为正面次数,分布表如下:

随机变量X(正面次数)对应事件概率P(X=x)计算逻辑
0(反,反)0.090.3×0.3=0.09
1(正,反)、(反,正)0.422×0.7×0.3=0.42
2(正,正)0.490.7×0.7=0.49
合计——1.00.09+0.42+0.49=1.0(合法)

不公平硬币的分布表中,“X=2”的概率最高(0.49),体现了“正面概率高”的偏倚,表格能直接反映这种分布的“倾斜性”。

实例3:骰子点数(多取值案例)

公平骰子的点数X(1~6),分布表如下:

随机变量X(骰子点数)概率P(X=x)计算逻辑
11/6≈0.16676种结果等概率
21/6≈0.1667同上
31/6≈0.1667同上
41/6≈0.1667同上
51/6≈0.1667同上
61/6≈0.1667同上
合计1.06×1/6=1.0(合法)

形式2:图形形式——直观展示“概率分布趋势”

离散随机变量的概率分布图形用柱状图(Bar Plot) 表示,“用柱子高度对应概率”,能快速看出“哪些取值的概率高、哪些低”。

图形的要素

横轴(x轴):随机变量的所有可能取值(必须按顺序排列,如0,1,2或1~6);
纵轴(y轴):对应取值的概率P(X=x)(范围0~1);
柱子:每个柱子对应一个取值,柱子的高度=该取值的概率,柱子之间必须有间隔(体现“离散性”,与连续变量的“折线图/曲线”区分);
验证:所有柱子的“面积之和”=1(因柱子宽度通常设为1,所以“高度之和=1”)。

在这里插入图片描述
对称分布(图1):抛两次公平硬币的分布呈“钟形对称”,中间取值(X=1)概率最高,两端对称;
偏倚分布(图2):不公平硬币的分布“右偏”,X=2(正面次数多)的概率最高,体现正面概率高的特性;
均匀分布(图3):骰子的分布是“平的”,所有取值概率相等;
递减分布(图4):交通事故数的分布呈“右递减”,X=0(无事故)概率最高,X越大概率越低(符合“稀有事件”特征)。

实验类型核心变量特征分布形态关键标志实验设计的核心逻辑
对称分布中间取值概率最高,两端对称钟形,两端柱子等高用“公平硬币”确保取值概率对称
偏倚分布某一取值概率显著更高向高概率取值倾斜(如右偏、左偏)用“不公平硬币”制造概率偏倚
均匀分布所有取值概率完全相等水平直线,所有柱子等高用“公平骰子”确保各取值等概率
递减分布取值越小,概率越高(稀有事件)右递减,柱子高度随X增大而降低选择“低概率事件”观测,体现稀有性
import numpy as np
import matplotlib.pyplot as plt
import math
# 设置中文字体
plt.rcParams["font.family"] = ["SimHei"]
plt.rcParams["axes.unicode_minus"] = False# 创建2×2子图
fig, axes = plt.subplots(2, 2, figsize=(12, 10))
fig.suptitle("离散随机变量概率分布的图形表示(柱状图)", fontsize=16)# 1. 抛两次公平硬币(X=正面次数)
fair_coin_x = [0, 1, 2]
fair_coin_p = [0.25, 0.5, 0.25]
axes[0,0].bar(fair_coin_x, fair_coin_p, color="#4ECDC4", edgecolor="black", width=0.6)
axes[0,0].set_title("(1) 抛两次公平硬币(正面次数)", fontsize=12)
axes[0,0].set_xlabel("随机变量X(正面次数)")
axes[0,0].set_ylabel("概率P(X=x)")
axes[0,0].set_xticks(fair_coin_x)
axes[0,0].set_ylim(0, 0.6)
axes[0,0].grid(axis="y", alpha=0.3)
# 标注概率值
for x, p in zip(fair_coin_x, fair_coin_p):axes[0,0].text(x, p+0.02, f"{p:.2f}", ha="center", fontweight="bold")# 2. 抛两次不公平硬币(X=正面次数,正面概率0.7)
unfair_coin_x = [0, 1, 2]
unfair_coin_p = [0.09, 0.42, 0.49]
axes[0,1].bar(unfair_coin_x, unfair_coin_p, color="#FF6B6B", edgecolor="black", width=0.6)
axes[0,1].set_title("(2) 抛两次不公平硬币(正面概率0.7)", fontsize=12)
axes[0,1].set_xlabel("随机变量X(正面次数)")
axes[0,1].set_ylabel("概率P(X=x)")
axes[0,1].set_xticks(unfair_coin_x)
axes[0,1].set_ylim(0, 0.6)
axes[0,1].grid(axis="y", alpha=0.3)
for x, p in zip(unfair_coin_x, unfair_coin_p):axes[0,1].text(x, p+0.02, f"{p:.2f}", ha="center", fontweight="bold")# 3. 公平骰子(X=点数)
dice_x = [1, 2, 3, 4, 5, 6]
dice_p = [1/6]*6
axes[1,0].bar(dice_x, dice_p, color="#45B7D1", edgecolor="black", width=0.6)
axes[1,0].set_title("(3) 公平骰子(点数)", fontsize=12)
axes[1,0].set_xlabel("随机变量X(骰子点数)")
axes[1,0].set_ylabel("概率P(X=x)")
axes[1,0].set_xticks(dice_x)
axes[1,0].set_ylim(0, 0.2)
axes[1,0].grid(axis="y", alpha=0.3)
for x, p in zip(dice_x, dice_p):axes[1,0].text(x, p+0.01, f"{p:.3f}", ha="center", fontweight="bold")# 4. 某路口每小时交通事故数(X=事故数,泊松分布λ=2)
poisson_x = [0, 1, 2, 3, 4, 5]
poisson_p = [np.exp(-2)*2**k / math.factorial(k) for k in poisson_x]
axes[1,1].bar(poisson_x, poisson_p, color="#FFA07A", edgecolor="black", width=0.6)
axes[1,1].set_title("(4) 每小时交通事故数(泊松分布λ=2)", fontsize=12)
axes[1,1].set_xlabel("随机变量X(事故数)")
axes[1,1].set_ylabel("概率P(X=x)")
axes[1,1].set_xticks(poisson_x)
axes[1,1].set_ylim(0, 0.3)
axes[1,1].grid(axis="y", alpha=0.3)
for x, p in zip(poisson_x, poisson_p):axes[1,1].text(x, p+0.01, f"{p:.3f}", ha="center", fontweight="bold")# 调整布局
plt.tight_layout(rect=[0, 0, 1, 0.95])
plt.show()

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

import numpy as np
import matplotlib.pyplot as plt# 设置中文字体,确保中文正常显示
plt.rcParams["font.family"] = ["SimHei"]
plt.rcParams["axes.unicode_minus"] = False  # 解决负号显示问题# 创建一个包含3个子图的图形
fig, axes = plt.subplots(1, 3, figsize=(18, 5))
fig.suptitle('不同离散随机变量的概率质量函数(PMF)', fontsize=16)# --------------------------
# 例子1:公平骰子的PMF
# --------------------------
# 可能的取值:1-6
dice_values = np.array([1, 2, 3, 4, 5, 6])
# 公平骰子每个值的概率都是1/6
dice_probs = np.array([1/6]*6)axes[0].bar(dice_values, dice_probs, color='skyblue', edgecolor='black')
axes[0].set_title('(1) 公平骰子的PMF', fontsize=14)
axes[0].set_xlabel('骰子点数', fontsize=12)
axes[0].set_ylabel('概率 P(X=x)', fontsize=12)
axes[0].set_xticks(dice_values)  # 设置x轴刻度为离散取值
axes[0].set_ylim(0, 0.2)  # 设置y轴范围
axes[0].grid(axis='y', alpha=0.3)# 在柱子上方标注概率值
for x, p in zip(dice_values, dice_probs):axes[0].text(x, p+0.005, f'{p:.2f}', ha='center', fontsize=10)# --------------------------
# 例子2:抛两次硬币,正面次数的PMF
# --------------------------
# 可能的取值:0,1,2(正面次数)
coin_values = np.array([0, 1, 2])
# 对应的概率:P(0)=1/4, P(1)=1/2, P(2)=1/4
coin_probs = np.array([1/4, 1/2, 1/4])axes[1].bar(coin_values, coin_probs, color='lightgreen', edgecolor='black')
axes[1].set_title('(2) 抛两次硬币正面次数的PMF', fontsize=14)
axes[1].set_xlabel('正面次数', fontsize=12)
axes[1].set_ylabel('概率 P(X=x)', fontsize=12)
axes[1].set_xticks(coin_values)
axes[1].set_ylim(0, 0.6)
axes[1].grid(axis='y', alpha=0.3)# 在柱子上方标注概率值
for x, p in zip(coin_values, coin_probs):axes[1].text(x, p+0.01, f'{p:.2f}', ha='center', fontsize=10)# --------------------------
# 例子3:不公平骰子的PMF
# --------------------------
# 可能的取值:1-6
unfair_dice_values = np.array([1, 2, 3, 4, 5, 6])
# 不公平骰子的概率:1点概率为0.5,其他点各为0.1
unfair_dice_probs = np.array([0.5, 0.1, 0.1, 0.1, 0.1, 0.1])axes[2].bar(unfair_dice_values, unfair_dice_probs, color='salmon', edgecolor='black')
axes[2].set_title('(3) 不公平骰子的PMF', fontsize=14)
axes[2].set_xlabel('骰子点数', fontsize=12)
axes[2].set_ylabel('概率 P(X=x)', fontsize=12)
axes[2].set_xticks(unfair_dice_values)
axes[2].set_ylim(0, 0.6)
axes[2].grid(axis='y', alpha=0.3)# 在柱子上方标注概率值
for x, p in zip(unfair_dice_values, unfair_dice_probs):axes[2].text(x, p+0.01, f'{p:.1f}', ha='center', fontsize=10)# 调整布局,避免标签重叠
plt.tight_layout(rect=[0, 0, 1, 0.96])  # 为suptitle留出空间
plt.show()

形式3:函数形式——严谨的数学表达 PMF(概率质量函数)

PMF是概率分布的“函数化表示”,将“取值-概率”的对应关系抽象为数学函数

PMF的定义

概率质量函数(Probability Mass Function, PMF) 是一个定义在“随机变量所有可能取值上”的函数,记为pX(x)p_X(x)pX(x)(或简化为p(x)p(x)p(x)),其核心定义为:
p(x)=P(X=x)p(x) = P(X = x)p(x)=P(X=x)
即“函数值p(x)p(x)p(x)等于随机变量X取值为x的概率”。

PMF是“表格的数学浓缩”——它用函数语言替代了冗长的表格,例如“抛两次公平硬币”的PMF,一句话就能概括:“p(0)=0.25,p(1)=0.5,p(2)=0.25p(0)=0.25, p(1)=0.5, p(2)=0.25p(0)=0.25,p(1)=0.5,p(2)=0.25,其他x的p(x)=0p(x)=0p(x)=0”。

PMF的两种表示方式

根据随机变量的分布类型,PMF有两种主要表示:分段函数(针对简单分布)公式化函数(针对通用分布)

方式1:分段函数(简单分布,如抛硬币、骰子)

分段函数直接列出“每个取值的概率”,适合取值少的简单分布。

实例1:抛两次公平硬币的PMF(分段函数)

p(x)={0.25if x=0,0.5if x=1,0.25if x=2,0otherwise. p(x) = \begin{cases} 0.25 & \text{if } x=0, \\ 0.5 & \text{if } x=1, \\ 0.25 & \text{if } x=2, \\ 0 & \text{otherwise.} \end{cases} p(x)=0.250.50.250if x=0,if x=1,if x=2,otherwise.
解释:“otherwise”(其他情况)表示“非X的可能取值”(如x=3、x=0.5等),其概率为0;
验证:0.25+0.5+0.25=1(满足归一性),所有p(x)≥0(满足非负性)。

实例2:公平骰子的PMF(分段函数)

p(x)={16if x=1,2,3,4,5,6,0otherwise. p(x) = \begin{cases} \frac{1}{6} & \text{if } x=1,2,3,4,5,6, \\ 0 & \text{otherwise.} \end{cases} p(x)={610if x=1,2,3,4,5,6,otherwise.

方式2:公式化函数(通用分布,如二项分布、泊松分布)

当分布有“通用规律”时(如“n次伯努利试验的成功次数”),PMF可以用一个公式概括,无需逐一列出取值——这是PMF最强大的地方。

实例:二项分布的PMF(通用公式)

场景:n次独立伯努利试验(每次试验“成功/失败”,成功概率p),随机变量X为“成功次数”,其PMF公式为:
p(k)=(nk)pk(1−p)n−k(k=0,1,2,...,n) p(k) = \binom{n}{k} p^k (1-p)^{n-k} \quad (k=0,1,2,...,n) p(k)=(kn)pk(1p)nk(k=0,1,2,...,n)
其中:

  • (nk)=n!k!(n−k)!\binom{n}{k} = \frac{n!}{k!(n-k)!}(kn)=k!(nk)!n!:组合数,表示“n次试验中选k次成功的方式数”(如抛两次硬币选1次成功,(21)=2\binom{2}{1}=2(12)=2种方式);
  • pkp^kpk:k次成功的概率;
  • (1−p)n−k(1-p)^{n-k}(1p)nk:n-k次失败的概率。
用公式验证抛两次公平硬币:

n=2,p=0.5,k=0,1,2:

  • k=0:(20)×0.50×0.52=1×1×0.25=0.25\binom{2}{0}×0.5^0×0.5^2=1×1×0.25=0.25(02)×0.50×0.52=1×1×0.25=0.25(正确);
  • k=1:(21)×0.51×0.51=2×0.5×0.5=0.5\binom{2}{1}×0.5^1×0.5^1=2×0.5×0.5=0.5(12)×0.51×0.51=2×0.5×0.5=0.5(正确);
  • k=2:(22)×0.52×0.50=1×0.25×1=0.25\binom{2}{2}×0.5^2×0.5^0=1×0.25×1=0.25(22)×0.52×0.50=1×0.25×1=0.25(正确)。
其他常见分布的PMF公式:
  1. 泊松分布(单位时间内稀有事件发生次数):
    p(k)=e−λλkk!(k=0,1,2,...)p(k) = \frac{e^{-\lambda} \lambda^k}{k!} \quad (k=0,1,2,...)p(k)=k!eλλk(k=0,1,2,...)
    (λ:单位时间内事件的平均发生次数,e≈2.718)

  2. 几何分布(首次成功所需的试验次数):
    p(k)=(1−p)k−1p(k=1,2,...)p(k) = (1-p)^{k-1} p \quad (k=1,2,...)p(k)=(1p)k1p(k=1,2,...)
    (p:单次试验成功概率)

PMF的两条件(合法性验证)

不是所有函数都能叫PMF——必须满足以下两个条件,否则就是“非法的概率分布”:

条件1:非负性(概率不能为负)

对随机变量X的所有可能取值x,都有:
p(x)≥0p(x) \geq 0p(x)0

条件2:归一性(总概率为1)

对随机变量X的所有可能取值x,其概率之和为1:
∑xp(x)=1\sum_{x} p(x) = 1xp(x)=1

三、如果做实验可以这样做

对称分布实验:抛两次公平硬币,观察“正面次数”的分布

实验目的

验证离散随机变量(正面次数X)的概率分布是否呈对称形态——中间取值概率最高,两端取值概率相等且对称。

实验材料

1枚公平硬币(正反面材质均匀,抛掷后正面朝上概率P(正)=0.5,反面朝上概率P(反)=0.5);
记录纸、笔(或电子表格,用于统计次数)。

实验步骤
  1. 明确随机变量定义:设定X为“抛两次硬币后出现的正面次数”,则X的可能取值为:0(两次全反)、1(一正一反)、2(两次全正)。
  2. 单次实验操作:将硬币抛起,待落地稳定后记录“正”或“反”;重复抛第二次,记录结果;最终统计该组(两次抛掷)的“正面次数X”(如“正+反”对应X=1)。
  3. 重复实验以逼近真实概率
    理论上,实验次数越多,结果越接近真实概率分布。建议至少重复100组(即抛100×2=200次硬币),避免随机误差过大。
    每完成一组,就在记录纸上对应X值(0、1、2)的位置画“正”字计数。
  4. 计算频率:实验结束后,统计X=0、1、2的“出现次数”,再分别除以总实验组数(如100组),得到各取值的频率(频率会逼近真实概率)。
实验记录与分析

记录表格(示例:100组实验)

正面次数X出现次数频率(≈概率)
0230.23(≈1/4)
1540.54(≈1/2)
2230.23(≈1/4)

对应PMF与分布特征
真实PMF为 p(x)={1/4,x=0或21/2,x=10,其他p(x)=\begin{cases}1/4, & x=0或2 \\ 1/2, & x=1 \\ 0, & 其他\end{cases}p(x)=1/4,1/2,0,x=02x=1其他
绘制柱状图时,横轴为X(0、1、2),纵轴为频率/概率:
中间X=1的柱子最高(概率1/2),两端X=0和X=2的柱子高度相等(均为1/4),呈钟形对称,完美体现“对称分布”的核心特征。

偏倚分布实验:抛两次不公平硬币,观察“正面次数”的分布

实验目的

验证当随机变量的取值概率受“偏倚条件”影响时,分布会向概率高的取值倾斜(如“右偏”“左偏”)。本实验以“正面概率更高”为例,观察右偏分布。

实验材料

1枚不公平硬币
记录纸、笔(或电子表格)。

实验步骤
  1. 随机变量定义:与对称分布实验一致,X为“抛两次后的正面次数”,可能取值仍为0、1、2。
  2. 单次实验操作:同前——连续抛两次不公平硬币,记录每组的正面次数X。
  3. 重复实验:同样至少重复100组,减少随机误差,记录X=0、1、2的出现次数。
  4. 计算频率:用“出现次数÷总组数”得到各取值的频率,对比理论概率。
实验记录与分析

理论概率与实验频率(示例:100组)

正面次数X理论概率(PMF)实验出现次数实验频率
00.3×0.3=0.09100.10
12×0.7×0.3=0.42410.41
20.7×0.7=0.49490.49

对应PMF与分布特征
真实PMF为 p(x)=(2x)0.7x0.32−xp(x) = \binom{2}{x} 0.7^x 0.3^{2-x}p(x)=(x2)0.7x0.32x(二项分布公式)
绘制柱状图时:
X=2的柱子最高(概率0.49),X=1次之(0.42),X=0最低(0.09);
分布整体向“取值更大的X=2”倾斜,呈现右偏分布,直观体现了“硬币正面概率高”的偏倚特性。

均匀分布实验:掷公平骰子,观察“朝上点数”的分布

实验目的

验证当随机变量的所有可能取值“概率完全相等”时,分布呈“水平均匀”形态,即均匀分布。

实验材料

1枚公平骰子(6个面分别标有1~6点,材质均匀,每个面朝上的概率均为1/6);
记录纸、笔(或电子表格)。

实验步骤
  1. 随机变量定义:设定X为“掷一次骰子后朝上的点数”,可能取值为1、2、3、4、5、6(共6个离散值)。
  2. 单次实验操作:将骰子放在手心摇晃后掷出,待稳定后记录朝上的点数X。
  3. 重复实验:均匀分布的随机误差更明显,建议至少重复120次(即掷120次骰子,确保每个取值的出现次数足够多),记录每次的X值。
  4. 计算频率:统计X=1~6的出现次数,用“出现次数÷总掷数”得到频率,逼近1/6的理论概率。
实验记录与分析

记录表格(示例:120次实验)

点数X出现次数频率(≈概率)
1210.175(≈1/6≈0.167)
2190.158
3200.167
4220.183
5180.150
6200.167

对应PMF与分布特征
真实PMF为 p(x)={1/6,x=1,2,...,60,其他p(x)=\begin{cases}1/6, & x=1,2,...,6 \\ 0, & 其他\end{cases}p(x)={1/6,0,x=1,2,...,6其他
绘制柱状图时:
横轴为X=1~6,纵轴为频率/概率;
6个柱子的高度基本一致(均接近1/6),呈水平直线状,完美体现“均匀分布”中“各取值概率相等”的核心特征。

四、简单的说 概率质量函数(Probability Mass Function, 简称PMF)

简单说,概率质量函数(Probability Mass Function, PMF)就是给“能一个个数出来的随机结果”,挨个标上“它发生的概率是多少”的“清单”——只不过这个清单是用函数的形式写的
为什么叫“质量函数”?这是从物理学借来的比喻。想象每个取值x是一个点,在这个点上有一个“质量”(概率),所有质量加起来是1,就像总质量为1的物体。概率就像质量一样“集中”在离散的点上。

抛两次公平的硬币,想知道“正面出现的次数”,定X为“抛两次硬币后出现的正面次数”,则X的可能取值为:0(两次全反)、1(一正一反)、2(两次全正)(这个“次数”就是“离散随机变量”,因为它只能是0、1、2这三个能数出来的数)。

  • 正面0次(两次都是反面)的概率是1/4;
  • 正面1次的概率是1/2;
  • 正面2次的概率是1/4;
  • 除此之外(比如正面3次),概率都是0。

把这些“结果→概率”的对应关系写成一个“规则”,就是PMF。它本质上在回答一个问题:“当这个随机变量取某个具体值时,概率到底是多少?”

那为啥要搞概率质量函数 PMF,直接列个表格不行吗?
表格能看,但不好“算”。比如想算“平均能出几次正面”(期望值),或者“正面次数不超过1次的概率”(累积概率),有了PMF这个“函数规则”,就能直接套公式算——不用每次都翻表格、一个个加,效率高多了。

五、用数学的方式说 概率质量函数(Probability Mass Function, 简称PMF)

设随机试验的样本空间为Ω\OmegaΩX:Ω→RX: \Omega \to \mathbb{R}X:ΩR是定义在样本空间上的离散型随机变量(即XXX的所有可能取值构成的集合是可数集,记为S={x1,x2,…,xn,… }S = \{x_1, x_2, \dots, x_n, \dots\}S={x1,x2,,xn,},称为XXX的“支撑集”)。

若函数pX:R→[0,1]p_X: \mathbb{R} \to [0, 1]pX:R[0,1]满足以下两个条件:

  1. 非负性:对任意x∈Rx \in \mathbb{R}xR,都有pX(x)≥0p_X(x) \geq 0pX(x)0
  2. 归一性(总概率为1):对XXX的所有可能取值求和,满足∑x∈SpX(x)=1\sum_{x \in S} p_X(x) = 1xSpX(x)=1
  3. 概率对应性:对任意x∈Sx \in SxSpX(x)=P(X=x)p_X(x) = P(X = x)pX(x)=P(X=x)(即函数值等于随机变量XXX取该值的概率);且对任意x∉Sx \notin Sx/SpX(x)=0p_X(x) = 0pX(x)=0(即随机变量不可能取到的值,其概率质量为0)。

则称函数pX(x)p_X(x)pX(x)为离散型随机变量XXX概率质量函数

补充:

PMF的本质是离散型随机变量“取值-概率”对应关系的函数化表示,它将“随机变量取某个特定值的概率”转化为一个定义域为实数集、值域为[0,1][0,1][0,1]的函数,且仅在随机变量的可能取值点上有非零值。
两个条件(非负性、归一性)是PMF的“合法性约束”——任何不满足这两个条件的函数,都不能称为某离散型随机变量的PMF。
符号pX(x)p_X(x)pX(x)中的下标XXX用于明确“该函数对应哪个随机变量”(当存在多个随机变量时可避免混淆),通常在上下文明确时可简写为p(x)p(x)p(x)


文章转载自:

http://bXv0ZScb.ckrnq.cn
http://6Uqk2rli.ckrnq.cn
http://jfwaaHrq.ckrnq.cn
http://JbETClMt.ckrnq.cn
http://qE2pyGyy.ckrnq.cn
http://LdMsTOB7.ckrnq.cn
http://msu9BBkD.ckrnq.cn
http://tXW73jFb.ckrnq.cn
http://v7V1adQK.ckrnq.cn
http://3DeFwS2D.ckrnq.cn
http://3KQ43SKP.ckrnq.cn
http://zS1YGQsc.ckrnq.cn
http://jCKYsKKl.ckrnq.cn
http://a2RV7L6m.ckrnq.cn
http://rBKc0dUp.ckrnq.cn
http://tlro2KFX.ckrnq.cn
http://gB2M8Gv6.ckrnq.cn
http://i11dUDEg.ckrnq.cn
http://toUQRC8m.ckrnq.cn
http://OoWdsDgd.ckrnq.cn
http://Rp8BvDAf.ckrnq.cn
http://FVD2D0zq.ckrnq.cn
http://V79SZpPK.ckrnq.cn
http://wsFZahEa.ckrnq.cn
http://VRN9yQIa.ckrnq.cn
http://VKJDrd5x.ckrnq.cn
http://GeIJugUg.ckrnq.cn
http://Ctjj5qY2.ckrnq.cn
http://bnGwNGaz.ckrnq.cn
http://Y9FCv1oa.ckrnq.cn
http://www.dtcms.com/a/381964.html

相关文章:

  • 解决前端部署版本追溯难题:vite-plugin-version-mark 实践
  • 【Linux网络】简易应用层协议定制
  • 剪/染前如何降低“想象错位”的风险:一次线上试发的记录(工具:RightHair)
  • 【数据结构与算法Trip第4站】摩尔投票法
  • Java的8 种基本类型 + 包装类,缓存池机制
  • AI 辅助完成复杂任务的亲身体验:使用Qoder 3 天完成 OneCode UI 升级
  • 二叉树基础学习(图文并茂)万字梳理
  • Qt 工程中 UI 文件在 Makefile 中的处理
  • Champ-基于3D的人物图像到动画视频生成框架
  • 深入探索 C++ 元组:从基础到高级应用
  • 第5节-连接表-Cross-Join连接
  • 2025年8月月赛 T2 T3
  • 在Linux上无法访问usb视频设备
  • AI行业应用全景透视:从理论到实践的深度探索
  • [硬件电路-192]:基级与发射极两端的电压超过1.5v可能是什么原因
  • OpenTenBase应用落地实践:从MySQL到OpenTenBase的平滑迁移
  • Redis常用数据结构及其底层实现
  • 深度卷积生成对抗网络
  • 打造精简高效的 uni-app 网络请求工具
  • 基于ZIGBEE的智能太阳能路灯系统设计(论文+源码)
  • Linux 磁盘I/O高占用进程排查指南:从定位到分析的完整流程
  • 20250913-02: Langchain概念:表达式语言(LCEL)
  • 【YOLO目标检测】获取COCO指标
  • React 18 过渡更新:并发渲染的艺术
  • node.js卸载并重新安装(超详细图文步骤)
  • 【CSS学习笔记3】css特性
  • k8s-Sidecar容器学习
  • 坦克大战的学习
  • 如何进行WEB安全性测试
  • 使用UV工具安装和管理Python环境