以表格形式,图像形式,函数形式来理解 概率质量函数(Probability Mass Function, PMF)
以表格形式,图像形式,函数形式来理解 概率质量函数(Probability Mass Function, PMF)
flyfish
不想看过程直接看文末
有图有代码
首先,我们需要理解什么是“概率”。概率是用来衡量事件发生可能性的一个数字。它总是介于0和1之间:0意味着不可能发生,1意味着一定发生,0.5意味着一半一半的几率。比如,抛一枚公平硬币,正面朝上的概率是0.5。
在现实中,很多事情都是随机的,比如掷骰子、抽奖、天气预报。这些随机现象可以用“随机变量”来描述。随机变量就是一个变量,它的取值是随机的,但有一定的规律。我们把随机变量分成两种:离散型和连续型。这两种类型对应了PMF和PDF。
我们先从离散随机变量开始,因为它更简单、更直观,然后再过渡到连续随机变量。整个讲解会分成几个部分:基础概念、定义、例子、属性、比较,最后是应用。每个部分都会细致解释。
一、离散随机变量的基础
什么是离散随机变量?
想象一下,你在掷一个六面骰子。骰子的点数可能取值是1、2、3、4、5、6。这些取值是有限的、可以数清楚的,而且它们是“跳跃”的(比如没有1.5这样的值)。这种随机变量就叫离散随机变量(Discrete Random Variable)。离散的意思是“分散的、不连续的”。
更正式地说,离散随机变量的可能取值是一个有限集合,或者是一个可数无限集合(比如自然数1,2,3,…)。但在大多数实际问题中,都是有限的。
为什么叫“随机变量”?因为它的值不是固定的,而是随机的。但它不是完全乱的——每个取值都有一个概率。
如何描述离散随机变量的分布?
要描述一个离散随机变量,我们需要知道每个可能取值发生的概率。这就是概率分布(Probability Distribution)的概念。概率分布告诉我们:随机变量X取某个值x的概率是多少,用P(X = x)表示。
比如,对于骰子:
P(X=1) = 1/6
P(X=2) = 1/6
…
P(X=6) = 1/6
所有这些概率加起来必须等于1,因为总有一个结果会发生(骰子总会停下来)。
现在,我们引入概率质量函数(PMF)。PMF就是一种函数,它把每个可能取值x映射到它的概率P(X=x)。简单说,PMF是概率分布的“函数形式”。
二、概率质量函数(PMF)的形式
形式1:表格形式——“取值-概率”对应表
列出所有可能取值及其对应概率”
表格的标准结构
概率分布表由两列组成:
第一列(通常为“X”):离散随机变量的所有可能取值(必须完整,不能遗漏;取值需互斥,即一个结果只能对应一个取值);
第二列(通常为“P(X=x)”):对应取值的概率(需满足非负性和归一性)。
实例1:抛两次公平硬币(基础案例)
设随机变量X为“抛两次硬币的正面次数”,其概率分布表如下:
随机变量X(正面次数) | 对应事件(两次抛硬币的结果) | 概率P(X=x) | 计算逻辑(公平硬币,每次正面概率=0.5) |
---|---|---|---|
0 | (反,反) | 1/4 = 0.25 | 1种结果,概率=0.5×0.5=0.25 |
1 | (正,反)、(反,正) | 2/4 = 0.5 | 2种结果,概率=2×0.5×0.5=0.5 |
2 | (正,正) | 1/4 = 0.25 | 1种结果,概率=0.5×0.5=0.25 |
合计 | —— | 1.0 | 所有概率之和必须为1(验证分布合法性) |
一眼能看出“X=1时概率最高(0.5),X=0和X=2时概率相等(0.25)”,直接求和最后一行,若为1则是合法分布。
实例2:不公平硬币(体现非均匀分布)
设硬币正面概率=0.7,反面=0.3,抛两次后X为正面次数,分布表如下:
随机变量X(正面次数) | 对应事件 | 概率P(X=x) | 计算逻辑 |
---|---|---|---|
0 | (反,反) | 0.09 | 0.3×0.3=0.09 |
1 | (正,反)、(反,正) | 0.42 | 2×0.7×0.3=0.42 |
2 | (正,正) | 0.49 | 0.7×0.7=0.49 |
合计 | —— | 1.0 | 0.09+0.42+0.49=1.0(合法) |
不公平硬币的分布表中,“X=2”的概率最高(0.49),体现了“正面概率高”的偏倚,表格能直接反映这种分布的“倾斜性”。
实例3:骰子点数(多取值案例)
公平骰子的点数X(1~6),分布表如下:
随机变量X(骰子点数) | 概率P(X=x) | 计算逻辑 |
---|---|---|
1 | 1/6≈0.1667 | 6种结果等概率 |
2 | 1/6≈0.1667 | 同上 |
3 | 1/6≈0.1667 | 同上 |
4 | 1/6≈0.1667 | 同上 |
5 | 1/6≈0.1667 | 同上 |
6 | 1/6≈0.1667 | 同上 |
合计 | 1.0 | 6×1/6=1.0(合法) |
形式2:图形形式——直观展示“概率分布趋势”
离散随机变量的概率分布图形用柱状图(Bar Plot) 表示,“用柱子高度对应概率”,能快速看出“哪些取值的概率高、哪些低”。
图形的要素
横轴(x轴):随机变量的所有可能取值(必须按顺序排列,如0,1,2或1~6);
纵轴(y轴):对应取值的概率P(X=x)(范围0~1);
柱子:每个柱子对应一个取值,柱子的高度=该取值的概率,柱子之间必须有间隔(体现“离散性”,与连续变量的“折线图/曲线”区分);
验证:所有柱子的“面积之和”=1(因柱子宽度通常设为1,所以“高度之和=1”)。
对称分布(图1):抛两次公平硬币的分布呈“钟形对称”,中间取值(X=1)概率最高,两端对称;
偏倚分布(图2):不公平硬币的分布“右偏”,X=2(正面次数多)的概率最高,体现正面概率高的特性;
均匀分布(图3):骰子的分布是“平的”,所有取值概率相等;
递减分布(图4):交通事故数的分布呈“右递减”,X=0(无事故)概率最高,X越大概率越低(符合“稀有事件”特征)。
实验类型 | 核心变量特征 | 分布形态关键标志 | 实验设计的核心逻辑 |
---|---|---|---|
对称分布 | 中间取值概率最高,两端对称 | 钟形,两端柱子等高 | 用“公平硬币”确保取值概率对称 |
偏倚分布 | 某一取值概率显著更高 | 向高概率取值倾斜(如右偏、左偏) | 用“不公平硬币”制造概率偏倚 |
均匀分布 | 所有取值概率完全相等 | 水平直线,所有柱子等高 | 用“公平骰子”确保各取值等概率 |
递减分布 | 取值越小,概率越高(稀有事件) | 右递减,柱子高度随X增大而降低 | 选择“低概率事件”观测,体现稀有性 |
import numpy as np
import matplotlib.pyplot as plt
import math
# 设置中文字体
plt.rcParams["font.family"] = ["SimHei"]
plt.rcParams["axes.unicode_minus"] = False# 创建2×2子图
fig, axes = plt.subplots(2, 2, figsize=(12, 10))
fig.suptitle("离散随机变量概率分布的图形表示(柱状图)", fontsize=16)# 1. 抛两次公平硬币(X=正面次数)
fair_coin_x = [0, 1, 2]
fair_coin_p = [0.25, 0.5, 0.25]
axes[0,0].bar(fair_coin_x, fair_coin_p, color="#4ECDC4", edgecolor="black", width=0.6)
axes[0,0].set_title("(1) 抛两次公平硬币(正面次数)", fontsize=12)
axes[0,0].set_xlabel("随机变量X(正面次数)")
axes[0,0].set_ylabel("概率P(X=x)")
axes[0,0].set_xticks(fair_coin_x)
axes[0,0].set_ylim(0, 0.6)
axes[0,0].grid(axis="y", alpha=0.3)
# 标注概率值
for x, p in zip(fair_coin_x, fair_coin_p):axes[0,0].text(x, p+0.02, f"{p:.2f}", ha="center", fontweight="bold")# 2. 抛两次不公平硬币(X=正面次数,正面概率0.7)
unfair_coin_x = [0, 1, 2]
unfair_coin_p = [0.09, 0.42, 0.49]
axes[0,1].bar(unfair_coin_x, unfair_coin_p, color="#FF6B6B", edgecolor="black", width=0.6)
axes[0,1].set_title("(2) 抛两次不公平硬币(正面概率0.7)", fontsize=12)
axes[0,1].set_xlabel("随机变量X(正面次数)")
axes[0,1].set_ylabel("概率P(X=x)")
axes[0,1].set_xticks(unfair_coin_x)
axes[0,1].set_ylim(0, 0.6)
axes[0,1].grid(axis="y", alpha=0.3)
for x, p in zip(unfair_coin_x, unfair_coin_p):axes[0,1].text(x, p+0.02, f"{p:.2f}", ha="center", fontweight="bold")# 3. 公平骰子(X=点数)
dice_x = [1, 2, 3, 4, 5, 6]
dice_p = [1/6]*6
axes[1,0].bar(dice_x, dice_p, color="#45B7D1", edgecolor="black", width=0.6)
axes[1,0].set_title("(3) 公平骰子(点数)", fontsize=12)
axes[1,0].set_xlabel("随机变量X(骰子点数)")
axes[1,0].set_ylabel("概率P(X=x)")
axes[1,0].set_xticks(dice_x)
axes[1,0].set_ylim(0, 0.2)
axes[1,0].grid(axis="y", alpha=0.3)
for x, p in zip(dice_x, dice_p):axes[1,0].text(x, p+0.01, f"{p:.3f}", ha="center", fontweight="bold")# 4. 某路口每小时交通事故数(X=事故数,泊松分布λ=2)
poisson_x = [0, 1, 2, 3, 4, 5]
poisson_p = [np.exp(-2)*2**k / math.factorial(k) for k in poisson_x]
axes[1,1].bar(poisson_x, poisson_p, color="#FFA07A", edgecolor="black", width=0.6)
axes[1,1].set_title("(4) 每小时交通事故数(泊松分布λ=2)", fontsize=12)
axes[1,1].set_xlabel("随机变量X(事故数)")
axes[1,1].set_ylabel("概率P(X=x)")
axes[1,1].set_xticks(poisson_x)
axes[1,1].set_ylim(0, 0.3)
axes[1,1].grid(axis="y", alpha=0.3)
for x, p in zip(poisson_x, poisson_p):axes[1,1].text(x, p+0.01, f"{p:.3f}", ha="center", fontweight="bold")# 调整布局
plt.tight_layout(rect=[0, 0, 1, 0.95])
plt.show()
import numpy as np
import matplotlib.pyplot as plt# 设置中文字体,确保中文正常显示
plt.rcParams["font.family"] = ["SimHei"]
plt.rcParams["axes.unicode_minus"] = False # 解决负号显示问题# 创建一个包含3个子图的图形
fig, axes = plt.subplots(1, 3, figsize=(18, 5))
fig.suptitle('不同离散随机变量的概率质量函数(PMF)', fontsize=16)# --------------------------
# 例子1:公平骰子的PMF
# --------------------------
# 可能的取值:1-6
dice_values = np.array([1, 2, 3, 4, 5, 6])
# 公平骰子每个值的概率都是1/6
dice_probs = np.array([1/6]*6)axes[0].bar(dice_values, dice_probs, color='skyblue', edgecolor='black')
axes[0].set_title('(1) 公平骰子的PMF', fontsize=14)
axes[0].set_xlabel('骰子点数', fontsize=12)
axes[0].set_ylabel('概率 P(X=x)', fontsize=12)
axes[0].set_xticks(dice_values) # 设置x轴刻度为离散取值
axes[0].set_ylim(0, 0.2) # 设置y轴范围
axes[0].grid(axis='y', alpha=0.3)# 在柱子上方标注概率值
for x, p in zip(dice_values, dice_probs):axes[0].text(x, p+0.005, f'{p:.2f}', ha='center', fontsize=10)# --------------------------
# 例子2:抛两次硬币,正面次数的PMF
# --------------------------
# 可能的取值:0,1,2(正面次数)
coin_values = np.array([0, 1, 2])
# 对应的概率:P(0)=1/4, P(1)=1/2, P(2)=1/4
coin_probs = np.array([1/4, 1/2, 1/4])axes[1].bar(coin_values, coin_probs, color='lightgreen', edgecolor='black')
axes[1].set_title('(2) 抛两次硬币正面次数的PMF', fontsize=14)
axes[1].set_xlabel('正面次数', fontsize=12)
axes[1].set_ylabel('概率 P(X=x)', fontsize=12)
axes[1].set_xticks(coin_values)
axes[1].set_ylim(0, 0.6)
axes[1].grid(axis='y', alpha=0.3)# 在柱子上方标注概率值
for x, p in zip(coin_values, coin_probs):axes[1].text(x, p+0.01, f'{p:.2f}', ha='center', fontsize=10)# --------------------------
# 例子3:不公平骰子的PMF
# --------------------------
# 可能的取值:1-6
unfair_dice_values = np.array([1, 2, 3, 4, 5, 6])
# 不公平骰子的概率:1点概率为0.5,其他点各为0.1
unfair_dice_probs = np.array([0.5, 0.1, 0.1, 0.1, 0.1, 0.1])axes[2].bar(unfair_dice_values, unfair_dice_probs, color='salmon', edgecolor='black')
axes[2].set_title('(3) 不公平骰子的PMF', fontsize=14)
axes[2].set_xlabel('骰子点数', fontsize=12)
axes[2].set_ylabel('概率 P(X=x)', fontsize=12)
axes[2].set_xticks(unfair_dice_values)
axes[2].set_ylim(0, 0.6)
axes[2].grid(axis='y', alpha=0.3)# 在柱子上方标注概率值
for x, p in zip(unfair_dice_values, unfair_dice_probs):axes[2].text(x, p+0.01, f'{p:.1f}', ha='center', fontsize=10)# 调整布局,避免标签重叠
plt.tight_layout(rect=[0, 0, 1, 0.96]) # 为suptitle留出空间
plt.show()
形式3:函数形式——严谨的数学表达 PMF(概率质量函数)
PMF是概率分布的“函数化表示”,将“取值-概率”的对应关系抽象为数学函数
PMF的定义
概率质量函数(Probability Mass Function, PMF) 是一个定义在“随机变量所有可能取值上”的函数,记为pX(x)p_X(x)pX(x)(或简化为p(x)p(x)p(x)),其核心定义为:
p(x)=P(X=x)p(x) = P(X = x)p(x)=P(X=x)
即“函数值p(x)p(x)p(x)等于随机变量X取值为x的概率”。
PMF是“表格的数学浓缩”——它用函数语言替代了冗长的表格,例如“抛两次公平硬币”的PMF,一句话就能概括:“p(0)=0.25,p(1)=0.5,p(2)=0.25p(0)=0.25, p(1)=0.5, p(2)=0.25p(0)=0.25,p(1)=0.5,p(2)=0.25,其他x的p(x)=0p(x)=0p(x)=0”。
PMF的两种表示方式
根据随机变量的分布类型,PMF有两种主要表示:分段函数(针对简单分布) 和公式化函数(针对通用分布)。
方式1:分段函数(简单分布,如抛硬币、骰子)
分段函数直接列出“每个取值的概率”,适合取值少的简单分布。
实例1:抛两次公平硬币的PMF(分段函数)
p(x)={0.25if x=0,0.5if x=1,0.25if x=2,0otherwise.
p(x) =
\begin{cases}
0.25 & \text{if } x=0, \\
0.5 & \text{if } x=1, \\
0.25 & \text{if } x=2, \\
0 & \text{otherwise.}
\end{cases}
p(x)=⎩⎨⎧0.250.50.250if x=0,if x=1,if x=2,otherwise.
解释:“otherwise”(其他情况)表示“非X的可能取值”(如x=3、x=0.5等),其概率为0;
验证:0.25+0.5+0.25=1(满足归一性),所有p(x)≥0(满足非负性)。
实例2:公平骰子的PMF(分段函数)
p(x)={16if x=1,2,3,4,5,6,0otherwise. p(x) = \begin{cases} \frac{1}{6} & \text{if } x=1,2,3,4,5,6, \\ 0 & \text{otherwise.} \end{cases} p(x)={610if x=1,2,3,4,5,6,otherwise.
方式2:公式化函数(通用分布,如二项分布、泊松分布)
当分布有“通用规律”时(如“n次伯努利试验的成功次数”),PMF可以用一个公式概括,无需逐一列出取值——这是PMF最强大的地方。
实例:二项分布的PMF(通用公式)
场景:n次独立伯努利试验(每次试验“成功/失败”,成功概率p),随机变量X为“成功次数”,其PMF公式为:
p(k)=(nk)pk(1−p)n−k(k=0,1,2,...,n)
p(k) = \binom{n}{k} p^k (1-p)^{n-k} \quad (k=0,1,2,...,n)
p(k)=(kn)pk(1−p)n−k(k=0,1,2,...,n)
其中:
- (nk)=n!k!(n−k)!\binom{n}{k} = \frac{n!}{k!(n-k)!}(kn)=k!(n−k)!n!:组合数,表示“n次试验中选k次成功的方式数”(如抛两次硬币选1次成功,(21)=2\binom{2}{1}=2(12)=2种方式);
- pkp^kpk:k次成功的概率;
- (1−p)n−k(1-p)^{n-k}(1−p)n−k:n-k次失败的概率。
用公式验证抛两次公平硬币:
n=2,p=0.5,k=0,1,2:
- k=0:(20)×0.50×0.52=1×1×0.25=0.25\binom{2}{0}×0.5^0×0.5^2=1×1×0.25=0.25(02)×0.50×0.52=1×1×0.25=0.25(正确);
- k=1:(21)×0.51×0.51=2×0.5×0.5=0.5\binom{2}{1}×0.5^1×0.5^1=2×0.5×0.5=0.5(12)×0.51×0.51=2×0.5×0.5=0.5(正确);
- k=2:(22)×0.52×0.50=1×0.25×1=0.25\binom{2}{2}×0.5^2×0.5^0=1×0.25×1=0.25(22)×0.52×0.50=1×0.25×1=0.25(正确)。
其他常见分布的PMF公式:
-
泊松分布(单位时间内稀有事件发生次数):
p(k)=e−λλkk!(k=0,1,2,...)p(k) = \frac{e^{-\lambda} \lambda^k}{k!} \quad (k=0,1,2,...)p(k)=k!e−λλk(k=0,1,2,...)
(λ:单位时间内事件的平均发生次数,e≈2.718) -
几何分布(首次成功所需的试验次数):
p(k)=(1−p)k−1p(k=1,2,...)p(k) = (1-p)^{k-1} p \quad (k=1,2,...)p(k)=(1−p)k−1p(k=1,2,...)
(p:单次试验成功概率)
PMF的两条件(合法性验证)
不是所有函数都能叫PMF——必须满足以下两个条件,否则就是“非法的概率分布”:
条件1:非负性(概率不能为负)
对随机变量X的所有可能取值x,都有:
p(x)≥0p(x) \geq 0p(x)≥0
条件2:归一性(总概率为1)
对随机变量X的所有可能取值x,其概率之和为1:
∑xp(x)=1\sum_{x} p(x) = 1x∑p(x)=1
三、如果做实验可以这样做
对称分布实验:抛两次公平硬币,观察“正面次数”的分布
实验目的
验证离散随机变量(正面次数X)的概率分布是否呈对称形态——中间取值概率最高,两端取值概率相等且对称。
实验材料
1枚公平硬币(正反面材质均匀,抛掷后正面朝上概率P(正)=0.5,反面朝上概率P(反)=0.5);
记录纸、笔(或电子表格,用于统计次数)。
实验步骤
- 明确随机变量定义:设定X为“抛两次硬币后出现的正面次数”,则X的可能取值为:0(两次全反)、1(一正一反)、2(两次全正)。
- 单次实验操作:将硬币抛起,待落地稳定后记录“正”或“反”;重复抛第二次,记录结果;最终统计该组(两次抛掷)的“正面次数X”(如“正+反”对应X=1)。
- 重复实验以逼近真实概率:
理论上,实验次数越多,结果越接近真实概率分布。建议至少重复100组(即抛100×2=200次硬币),避免随机误差过大。
每完成一组,就在记录纸上对应X值(0、1、2)的位置画“正”字计数。 - 计算频率:实验结束后,统计X=0、1、2的“出现次数”,再分别除以总实验组数(如100组),得到各取值的频率(频率会逼近真实概率)。
实验记录与分析
记录表格(示例:100组实验)
正面次数X | 出现次数 | 频率(≈概率) |
---|---|---|
0 | 23 | 0.23(≈1/4) |
1 | 54 | 0.54(≈1/2) |
2 | 23 | 0.23(≈1/4) |
对应PMF与分布特征:
真实PMF为 p(x)={1/4,x=0或21/2,x=10,其他p(x)=\begin{cases}1/4, & x=0或2 \\ 1/2, & x=1 \\ 0, & 其他\end{cases}p(x)=⎩⎨⎧1/4,1/2,0,x=0或2x=1其他
绘制柱状图时,横轴为X(0、1、2),纵轴为频率/概率:
中间X=1的柱子最高(概率1/2),两端X=0和X=2的柱子高度相等(均为1/4),呈钟形对称,完美体现“对称分布”的核心特征。
偏倚分布实验:抛两次不公平硬币,观察“正面次数”的分布
实验目的
验证当随机变量的取值概率受“偏倚条件”影响时,分布会向概率高的取值倾斜(如“右偏”“左偏”)。本实验以“正面概率更高”为例,观察右偏分布。
实验材料
1枚不公平硬币
记录纸、笔(或电子表格)。
实验步骤
- 随机变量定义:与对称分布实验一致,X为“抛两次后的正面次数”,可能取值仍为0、1、2。
- 单次实验操作:同前——连续抛两次不公平硬币,记录每组的正面次数X。
- 重复实验:同样至少重复100组,减少随机误差,记录X=0、1、2的出现次数。
- 计算频率:用“出现次数÷总组数”得到各取值的频率,对比理论概率。
实验记录与分析
理论概率与实验频率(示例:100组)
正面次数X | 理论概率(PMF) | 实验出现次数 | 实验频率 |
---|---|---|---|
0 | 0.3×0.3=0.09 | 10 | 0.10 |
1 | 2×0.7×0.3=0.42 | 41 | 0.41 |
2 | 0.7×0.7=0.49 | 49 | 0.49 |
对应PMF与分布特征:
真实PMF为 p(x)=(2x)0.7x0.32−xp(x) = \binom{2}{x} 0.7^x 0.3^{2-x}p(x)=(x2)0.7x0.32−x(二项分布公式)
绘制柱状图时:
X=2的柱子最高(概率0.49),X=1次之(0.42),X=0最低(0.09);
分布整体向“取值更大的X=2”倾斜,呈现右偏分布,直观体现了“硬币正面概率高”的偏倚特性。
均匀分布实验:掷公平骰子,观察“朝上点数”的分布
实验目的
验证当随机变量的所有可能取值“概率完全相等”时,分布呈“水平均匀”形态,即均匀分布。
实验材料
1枚公平骰子(6个面分别标有1~6点,材质均匀,每个面朝上的概率均为1/6);
记录纸、笔(或电子表格)。
实验步骤
- 随机变量定义:设定X为“掷一次骰子后朝上的点数”,可能取值为1、2、3、4、5、6(共6个离散值)。
- 单次实验操作:将骰子放在手心摇晃后掷出,待稳定后记录朝上的点数X。
- 重复实验:均匀分布的随机误差更明显,建议至少重复120次(即掷120次骰子,确保每个取值的出现次数足够多),记录每次的X值。
- 计算频率:统计X=1~6的出现次数,用“出现次数÷总掷数”得到频率,逼近1/6的理论概率。
实验记录与分析
记录表格(示例:120次实验)
点数X | 出现次数 | 频率(≈概率) |
---|---|---|
1 | 21 | 0.175(≈1/6≈0.167) |
2 | 19 | 0.158 |
3 | 20 | 0.167 |
4 | 22 | 0.183 |
5 | 18 | 0.150 |
6 | 20 | 0.167 |
对应PMF与分布特征:
真实PMF为 p(x)={1/6,x=1,2,...,60,其他p(x)=\begin{cases}1/6, & x=1,2,...,6 \\ 0, & 其他\end{cases}p(x)={1/6,0,x=1,2,...,6其他
绘制柱状图时:
横轴为X=1~6,纵轴为频率/概率;
6个柱子的高度基本一致(均接近1/6),呈水平直线状,完美体现“均匀分布”中“各取值概率相等”的核心特征。
四、简单的说 概率质量函数(Probability Mass Function, 简称PMF)
简单说,概率质量函数(Probability Mass Function, PMF)就是给“能一个个数出来的随机结果”,挨个标上“它发生的概率是多少”的“清单”——只不过这个清单是用函数的形式写的
为什么叫“质量函数”?这是从物理学借来的比喻。想象每个取值x是一个点,在这个点上有一个“质量”(概率),所有质量加起来是1,就像总质量为1的物体。概率就像质量一样“集中”在离散的点上。
抛两次公平的硬币,想知道“正面出现的次数”,定X为“抛两次硬币后出现的正面次数”,则X的可能取值为:0(两次全反)、1(一正一反)、2(两次全正)(这个“次数”就是“离散随机变量”,因为它只能是0、1、2这三个能数出来的数)。
- 正面0次(两次都是反面)的概率是1/4;
- 正面1次的概率是1/2;
- 正面2次的概率是1/4;
- 除此之外(比如正面3次),概率都是0。
把这些“结果→概率”的对应关系写成一个“规则”,就是PMF。它本质上在回答一个问题:“当这个随机变量取某个具体值时,概率到底是多少?”
那为啥要搞概率质量函数 PMF,直接列个表格不行吗?
表格能看,但不好“算”。比如想算“平均能出几次正面”(期望值),或者“正面次数不超过1次的概率”(累积概率),有了PMF这个“函数规则”,就能直接套公式算——不用每次都翻表格、一个个加,效率高多了。
五、用数学的方式说 概率质量函数(Probability Mass Function, 简称PMF)
设随机试验的样本空间为Ω\OmegaΩ,X:Ω→RX: \Omega \to \mathbb{R}X:Ω→R是定义在样本空间上的离散型随机变量(即XXX的所有可能取值构成的集合是可数集,记为S={x1,x2,…,xn,… }S = \{x_1, x_2, \dots, x_n, \dots\}S={x1,x2,…,xn,…},称为XXX的“支撑集”)。
若函数pX:R→[0,1]p_X: \mathbb{R} \to [0, 1]pX:R→[0,1]满足以下两个条件:
- 非负性:对任意x∈Rx \in \mathbb{R}x∈R,都有pX(x)≥0p_X(x) \geq 0pX(x)≥0;
- 归一性(总概率为1):对XXX的所有可能取值求和,满足∑x∈SpX(x)=1\sum_{x \in S} p_X(x) = 1∑x∈SpX(x)=1;
- 概率对应性:对任意x∈Sx \in Sx∈S,pX(x)=P(X=x)p_X(x) = P(X = x)pX(x)=P(X=x)(即函数值等于随机变量XXX取该值的概率);且对任意x∉Sx \notin Sx∈/S,pX(x)=0p_X(x) = 0pX(x)=0(即随机变量不可能取到的值,其概率质量为0)。
则称函数pX(x)p_X(x)pX(x)为离散型随机变量XXX的概率质量函数。
补充:
PMF的本质是离散型随机变量“取值-概率”对应关系的函数化表示,它将“随机变量取某个特定值的概率”转化为一个定义域为实数集、值域为[0,1][0,1][0,1]的函数,且仅在随机变量的可能取值点上有非零值。
两个条件(非负性、归一性)是PMF的“合法性约束”——任何不满足这两个条件的函数,都不能称为某离散型随机变量的PMF。
符号pX(x)p_X(x)pX(x)中的下标XXX用于明确“该函数对应哪个随机变量”(当存在多个随机变量时可避免混淆),通常在上下文明确时可简写为p(x)p(x)p(x)。