当前位置：首页 > news >正文

以表格形式，图像形式，函数形式来理解概率质量函数（Probability Mass Function, PMF）

news 2025/9/14 7:27:32

以表格形式，图像形式，函数形式来理解概率质量函数（Probability Mass Function, PMF）

flyfish

不想看过程直接看文末

有图有代码

首先，我们需要理解什么是“概率”。概率是用来衡量事件发生可能性的一个数字。它总是介于0和1之间：0意味着不可能发生，1意味着一定发生，0.5意味着一半一半的几率。比如，抛一枚公平硬币，正面朝上的概率是0.5。

在现实中，很多事情都是随机的，比如掷骰子、抽奖、天气预报。这些随机现象可以用“随机变量”来描述。随机变量就是一个变量，它的取值是随机的，但有一定的规律。我们把随机变量分成两种：离散型和连续型。这两种类型对应了PMF和PDF。

我们先从离散随机变量开始，因为它更简单、更直观，然后再过渡到连续随机变量。整个讲解会分成几个部分：基础概念、定义、例子、属性、比较，最后是应用。每个部分都会细致解释。

一、离散随机变量的基础

什么是离散随机变量？

想象一下，你在掷一个六面骰子。骰子的点数可能取值是1、2、3、4、5、6。这些取值是有限的、可以数清楚的，而且它们是“跳跃”的（比如没有1.5这样的值）。这种随机变量就叫离散随机变量（Discrete Random Variable）。离散的意思是“分散的、不连续的”。

更正式地说，离散随机变量的可能取值是一个有限集合，或者是一个可数无限集合（比如自然数1,2,3,…）。但在大多数实际问题中，都是有限的。

为什么叫“随机变量”？因为它的值不是固定的，而是随机的。但它不是完全乱的——每个取值都有一个概率。

如何描述离散随机变量的分布？

要描述一个离散随机变量，我们需要知道每个可能取值发生的概率。这就是概率分布（Probability Distribution）的概念。概率分布告诉我们：随机变量X取某个值x的概率是多少，用P(X = x)表示。

比如，对于骰子：
P(X=1) = 1/6
P(X=2) = 1/6
…
P(X=6) = 1/6

所有这些概率加起来必须等于1，因为总有一个结果会发生（骰子总会停下来）。

现在，我们引入概率质量函数（PMF）。PMF就是一种函数，它把每个可能取值x映射到它的概率P(X=x)。简单说，PMF是概率分布的“函数形式”。

二、概率质量函数（PMF）的形式

形式1：表格形式——“取值-概率”对应表

列出所有可能取值及其对应概率”

表格的标准结构

概率分布表由两列组成：
第一列（通常为“X”）：离散随机变量的所有可能取值（必须完整，不能遗漏；取值需互斥，即一个结果只能对应一个取值）；
第二列（通常为“P(X=x)”）：对应取值的概率（需满足非负性和归一性）。

实例1：抛两次公平硬币（基础案例）

设随机变量X为“抛两次硬币的正面次数”，其概率分布表如下：

随机变量X（正面次数）	对应事件（两次抛硬币的结果）	概率P(X=x)	计算逻辑（公平硬币，每次正面概率=0.5）
0	（反，反）	1/4 = 0.25	1种结果，概率=0.5×0.5=0.25
1	（正，反）、（反，正）	2/4 = 0.5	2种结果，概率=2×0.5×0.5=0.5
2	（正，正）	1/4 = 0.25	1种结果，概率=0.5×0.5=0.25
合计	——	1.0	所有概率之和必须为1（验证分布合法性）

一眼能看出“X=1时概率最高（0.5），X=0和X=2时概率相等（0.25）”，直接求和最后一行，若为1则是合法分布。

实例2：不公平硬币（体现非均匀分布）

设硬币正面概率=0.7，反面=0.3，抛两次后X为正面次数，分布表如下：

随机变量X（正面次数）	对应事件	概率P(X=x)	计算逻辑
0	（反，反）	0.09	0.3×0.3=0.09
1	（正，反）、（反，正）	0.42	2×0.7×0.3=0.42
2	（正，正）	0.49	0.7×0.7=0.49
合计	——	1.0	0.09+0.42+0.49=1.0（合法）

不公平硬币的分布表中，“X=2”的概率最高（0.49），体现了“正面概率高”的偏倚，表格能直接反映这种分布的“倾斜性”。

实例3：骰子点数（多取值案例）

公平骰子的点数X（1~6），分布表如下：

随机变量X（骰子点数）	概率P(X=x)	计算逻辑
1	1/6≈0.1667	6种结果等概率
2	1/6≈0.1667	同上
3	1/6≈0.1667	同上
4	1/6≈0.1667	同上
5	1/6≈0.1667	同上
6	1/6≈0.1667	同上
合计	1.0	6×1/6=1.0（合法）

形式2：图形形式——直观展示“概率分布趋势”

离散随机变量的概率分布图形用柱状图（Bar Plot） 表示，“用柱子高度对应概率”，能快速看出“哪些取值的概率高、哪些低”。

图形的要素

横轴（x轴）：随机变量的所有可能取值（必须按顺序排列，如0,1,2或1~6）；
纵轴（y轴）：对应取值的概率P(X=x)（范围0~1）；
柱子：每个柱子对应一个取值，柱子的高度=该取值的概率，柱子之间必须有间隔（体现“离散性”，与连续变量的“折线图/曲线”区分）；
验证：所有柱子的“面积之和”=1（因柱子宽度通常设为1，所以“高度之和=1”）。

在这里插入图片描述
对称分布（图1）：抛两次公平硬币的分布呈“钟形对称”，中间取值（X=1）概率最高，两端对称；
偏倚分布（图2）：不公平硬币的分布“右偏”，X=2（正面次数多）的概率最高，体现正面概率高的特性；
均匀分布（图3）：骰子的分布是“平的”，所有取值概率相等；
递减分布（图4）：交通事故数的分布呈“右递减”，X=0（无事故）概率最高，X越大概率越低（符合“稀有事件”特征）。

实验类型	核心变量特征	分布形态关键标志	实验设计的核心逻辑
对称分布	中间取值概率最高，两端对称	钟形，两端柱子等高	用“公平硬币”确保取值概率对称
偏倚分布	某一取值概率显著更高	向高概率取值倾斜（如右偏、左偏）	用“不公平硬币”制造概率偏倚
均匀分布	所有取值概率完全相等	水平直线，所有柱子等高	用“公平骰子”确保各取值等概率
递减分布	取值越小，概率越高（稀有事件）	右递减，柱子高度随X增大而降低	选择“低概率事件”观测，体现稀有性

import numpy as np
import matplotlib.pyplot as plt
import math
# 设置中文字体
plt.rcParams["font.family"] = ["SimHei"]
plt.rcParams["axes.unicode_minus"] = False# 创建2×2子图
fig, axes = plt.subplots(2, 2, figsize=(12, 10))
fig.suptitle("离散随机变量概率分布的图形表示（柱状图）", fontsize=16)# 1. 抛两次公平硬币（X=正面次数）
fair_coin_x = [0, 1, 2]
fair_coin_p = [0.25, 0.5, 0.25]
axes[0,0].bar(fair_coin_x, fair_coin_p, color="#4ECDC4", edgecolor="black", width=0.6)
axes[0,0].set_title("(1) 抛两次公平硬币（正面次数）", fontsize=12)
axes[0,0].set_xlabel("随机变量X（正面次数）")
axes[0,0].set_ylabel("概率P(X=x)")
axes[0,0].set_xticks(fair_coin_x)
axes[0,0].set_ylim(0, 0.6)
axes[0,0].grid(axis="y", alpha=0.3)
# 标注概率值
for x, p in zip(fair_coin_x, fair_coin_p):axes[0,0].text(x, p+0.02, f"{p:.2f}", ha="center", fontweight="bold")# 2. 抛两次不公平硬币（X=正面次数，正面概率0.7）
unfair_coin_x = [0, 1, 2]
unfair_coin_p = [0.09, 0.42, 0.49]
axes[0,1].bar(unfair_coin_x, unfair_coin_p, color="#FF6B6B", edgecolor="black", width=0.6)
axes[0,1].set_title("(2) 抛两次不公平硬币（正面概率0.7）", fontsize=12)
axes[0,1].set_xlabel("随机变量X（正面次数）")
axes[0,1].set_ylabel("概率P(X=x)")
axes[0,1].set_xticks(unfair_coin_x)
axes[0,1].set_ylim(0, 0.6)
axes[0,1].grid(axis="y", alpha=0.3)
for x, p in zip(unfair_coin_x, unfair_coin_p):axes[0,1].text(x, p+0.02, f"{p:.2f}", ha="center", fontweight="bold")# 3. 公平骰子（X=点数）
dice_x = [1, 2, 3, 4, 5, 6]
dice_p = [1/6]*6
axes[1,0].bar(dice_x, dice_p, color="#45B7D1", edgecolor="black", width=0.6)
axes[1,0].set_title("(3) 公平骰子（点数）", fontsize=12)
axes[1,0].set_xlabel("随机变量X（骰子点数）")
axes[1,0].set_ylabel("概率P(X=x)")
axes[1,0].set_xticks(dice_x)
axes[1,0].set_ylim(0, 0.2)
axes[1,0].grid(axis="y", alpha=0.3)
for x, p in zip(dice_x, dice_p):axes[1,0].text(x, p+0.01, f"{p:.3f}", ha="center", fontweight="bold")# 4. 某路口每小时交通事故数（X=事故数，泊松分布λ=2）
poisson_x = [0, 1, 2, 3, 4, 5]
poisson_p = [np.exp(-2)*2**k / math.factorial(k) for k in poisson_x]
axes[1,1].bar(poisson_x, poisson_p, color="#FFA07A", edgecolor="black", width=0.6)
axes[1,1].set_title("(4) 每小时交通事故数（泊松分布λ=2）", fontsize=12)
axes[1,1].set_xlabel("随机变量X（事故数）")
axes[1,1].set_ylabel("概率P(X=x)")
axes[1,1].set_xticks(poisson_x)
axes[1,1].set_ylim(0, 0.3)
axes[1,1].grid(axis="y", alpha=0.3)
for x, p in zip(poisson_x, poisson_p):axes[1,1].text(x, p+0.01, f"{p:.3f}", ha="center", fontweight="bold")# 调整布局
plt.tight_layout(rect=[0, 0, 1, 0.95])
plt.show()

在这里插入图片描述

import numpy as np
import matplotlib.pyplot as plt# 设置中文字体，确保中文正常显示
plt.rcParams["font.family"] = ["SimHei"]
plt.rcParams["axes.unicode_minus"] = False  # 解决负号显示问题# 创建一个包含3个子图的图形
fig, axes = plt.subplots(1, 3, figsize=(18, 5))
fig.suptitle('不同离散随机变量的概率质量函数(PMF)', fontsize=16)# --------------------------
# 例子1：公平骰子的PMF
# --------------------------
# 可能的取值：1-6
dice_values = np.array([1, 2, 3, 4, 5, 6])
# 公平骰子每个值的概率都是1/6
dice_probs = np.array([1/6]*6)axes[0].bar(dice_values, dice_probs, color='skyblue', edgecolor='black')
axes[0].set_title('(1) 公平骰子的PMF', fontsize=14)
axes[0].set_xlabel('骰子点数', fontsize=12)
axes[0].set_ylabel('概率 P(X=x)', fontsize=12)
axes[0].set_xticks(dice_values)  # 设置x轴刻度为离散取值
axes[0].set_ylim(0, 0.2)  # 设置y轴范围
axes[0].grid(axis='y', alpha=0.3)# 在柱子上方标注概率值
for x, p in zip(dice_values, dice_probs):axes[0].text(x, p+0.005, f'{p:.2f}', ha='center', fontsize=10)# --------------------------
# 例子2：抛两次硬币，正面次数的PMF
# --------------------------
# 可能的取值：0,1,2（正面次数）
coin_values = np.array([0, 1, 2])
# 对应的概率：P(0)=1/4, P(1)=1/2, P(2)=1/4
coin_probs = np.array([1/4, 1/2, 1/4])axes[1].bar(coin_values, coin_probs, color='lightgreen', edgecolor='black')
axes[1].set_title('(2) 抛两次硬币正面次数的PMF', fontsize=14)
axes[1].set_xlabel('正面次数', fontsize=12)
axes[1].set_ylabel('概率 P(X=x)', fontsize=12)
axes[1].set_xticks(coin_values)
axes[1].set_ylim(0, 0.6)
axes[1].grid(axis='y', alpha=0.3)# 在柱子上方标注概率值
for x, p in zip(coin_values, coin_probs):axes[1].text(x, p+0.01, f'{p:.2f}', ha='center', fontsize=10)# --------------------------
# 例子3：不公平骰子的PMF
# --------------------------
# 可能的取值：1-6
unfair_dice_values = np.array([1, 2, 3, 4, 5, 6])
# 不公平骰子的概率：1点概率为0.5，其他点各为0.1
unfair_dice_probs = np.array([0.5, 0.1, 0.1, 0.1, 0.1, 0.1])axes[2].bar(unfair_dice_values, unfair_dice_probs, color='salmon', edgecolor='black')
axes[2].set_title('(3) 不公平骰子的PMF', fontsize=14)
axes[2].set_xlabel('骰子点数', fontsize=12)
axes[2].set_ylabel('概率 P(X=x)', fontsize=12)
axes[2].set_xticks(unfair_dice_values)
axes[2].set_ylim(0, 0.6)
axes[2].grid(axis='y', alpha=0.3)# 在柱子上方标注概率值
for x, p in zip(unfair_dice_values, unfair_dice_probs):axes[2].text(x, p+0.01, f'{p:.1f}', ha='center', fontsize=10)# 调整布局，避免标签重叠
plt.tight_layout(rect=[0, 0, 1, 0.96])  # 为suptitle留出空间
plt.show()

形式3：函数形式——严谨的数学表达 PMF（概率质量函数）

PMF是概率分布的“函数化表示”，将“取值-概率”的对应关系抽象为数学函数

PMF的定义

概率质量函数（Probability Mass Function, PMF） 是一个定义在“随机变量所有可能取值上”的函数，记为 $p_X(x)$ （或简化为 $p (x)$ ），其核心定义为：
$p (x) = P (X = x)$
即“函数值 $p (x)$ 等于随机变量X取值为x的概率”。

PMF是“表格的数学浓缩”——它用函数语言替代了冗长的表格，例如“抛两次公平硬币”的PMF，一句话就能概括：“ $p (0) = 0.25, p (1) = 0.5, p (2) = 0.25$ ，其他x的 $p (x) = 0$ ”。

PMF的两种表示方式

根据随机变量的分布类型，PMF有两种主要表示：分段函数（针对简单分布） 和公式化函数（针对通用分布）。

方式1：分段函数（简单分布，如抛硬币、骰子）

分段函数直接列出“每个取值的概率”，适合取值少的简单分布。

实例1：抛两次公平硬币的PMF（分段函数）

$\begin{cases} 0.25 & \text{if } x=0, \\ 0.5 & \text{if } x=1, \\ 0.25 & \text{if } x=2, \\ 0 & \text{otherwise.} \end{cases}$
解释：“otherwise”（其他情况）表示“非X的可能取值”（如x=3、x=0.5等），其概率为0；
验证：0.25+0.5+0.25=1（满足归一性），所有p(x)≥0（满足非负性）。

实例2：公平骰子的PMF（分段函数）

$\begin{cases} \frac{1}{6} & \text{if } x=1,2,3,4,5,6, \\ 0 & \text{otherwise.} \end{cases}$

方式2：公式化函数（通用分布，如二项分布、泊松分布）

当分布有“通用规律”时（如“n次伯努利试验的成功次数”），PMF可以用一个公式概括，无需逐一列出取值——这是PMF最强大的地方。

实例：二项分布的PMF（通用公式）

场景：n次独立伯努利试验（每次试验“成功/失败”，成功概率p），随机变量X为“成功次数”，其PMF公式为：
$\binom{n}{k} p^k (1-p)^{n-k} \quad (k=0,1,2,...,n)$
其中：

$(nk)=n!k!(n−k)!\binom{n}{k} = \frac{n!}{k!(n-k)!}$ ：组合数，表示“n次试验中选k次成功的方式数”（如抛两次硬币选1次成功， $(21)=2\binom{2}{1}=2$ 种方式）；
$p^k$ ：k次成功的概率；
$1-p)^{n-k}$ ：n-k次失败的概率。

用公式验证抛两次公平硬币：

n=2，p=0.5，k=0,1,2：

k=0： $(20)×0.50×0.52=1×1×0.25=0.25\binom{2}{0}×0.5^0×0.5^2=1×1×0.25=0.25$ （正确）；
k=1： $(21)×0.51×0.51=2×0.5×0.5=0.5\binom{2}{1}×0.5^1×0.5^1=2×0.5×0.5=0.5$ （正确）；
k=2： $(22)×0.52×0.50=1×0.25×1=0.25\binom{2}{2}×0.5^2×0.5^0=1×0.25×1=0.25$ （正确）。

其他常见分布的PMF公式：

泊松分布（单位时间内稀有事件发生次数）：
$\frac{e^{-\lambda} \lambda^k}{k!} \quad (k=0,1,2,...)$
（λ：单位时间内事件的平均发生次数，e≈2.718）
几何分布（首次成功所需的试验次数）：
$(1-p)^{k-1} p \quad (k=1,2,...)$
（p：单次试验成功概率）

PMF的两条件（合法性验证）

不是所有函数都能叫PMF——必须满足以下两个条件，否则就是“非法的概率分布”：

条件1：非负性（概率不能为负）

对随机变量X的所有可能取值x，都有：
$\geq 0$

条件2：归一性（总概率为1）

对随机变量X的所有可能取值x，其概率之和为1：
$∑xp(x)=1\sum_{x} p(x) = 1$

三、如果做实验可以这样做

对称分布实验：抛两次公平硬币，观察“正面次数”的分布

实验目的

验证离散随机变量（正面次数X）的概率分布是否呈对称形态——中间取值概率最高，两端取值概率相等且对称。

实验材料

1枚公平硬币（正反面材质均匀，抛掷后正面朝上概率P(正)=0.5，反面朝上概率P(反)=0.5）；
记录纸、笔（或电子表格，用于统计次数）。

实验步骤

明确随机变量定义：设定X为“抛两次硬币后出现的正面次数”，则X的可能取值为：0（两次全反）、1（一正一反）、2（两次全正）。
单次实验操作：将硬币抛起，待落地稳定后记录“正”或“反”；重复抛第二次，记录结果；最终统计该组（两次抛掷）的“正面次数X”（如“正+反”对应X=1）。
重复实验以逼近真实概率：
理论上，实验次数越多，结果越接近真实概率分布。建议至少重复100组（即抛100×2=200次硬币），避免随机误差过大。
每完成一组，就在记录纸上对应X值（0、1、2）的位置画“正”字计数。
计算频率：实验结束后，统计X=0、1、2的“出现次数”，再分别除以总实验组数（如100组），得到各取值的频率（频率会逼近真实概率）。

实验记录与分析

记录表格（示例：100组实验）

正面次数X	出现次数	频率（≈概率）
0	23	0.23（≈1/4）
1	54	0.54（≈1/2）
2	23	0.23（≈1/4）

对应PMF与分布特征：
真实PMF为 $p(x)={1/4,x=0或21/2,x=10,其他p(x)=\begin{cases}1/4, & x=0或2 \\ 1/2, & x=1 \\ 0, & 其他\end{cases}$
绘制柱状图时，横轴为X（0、1、2），纵轴为频率/概率：
中间X=1的柱子最高（概率1/2），两端X=0和X=2的柱子高度相等（均为1/4），呈钟形对称，完美体现“对称分布”的核心特征。

偏倚分布实验：抛两次不公平硬币，观察“正面次数”的分布

实验目的

验证当随机变量的取值概率受“偏倚条件”影响时，分布会向概率高的取值倾斜（如“右偏”“左偏”）。本实验以“正面概率更高”为例，观察右偏分布。

实验材料

1枚不公平硬币
记录纸、笔（或电子表格）。

实验步骤

随机变量定义：与对称分布实验一致，X为“抛两次后的正面次数”，可能取值仍为0、1、2。
单次实验操作：同前——连续抛两次不公平硬币，记录每组的正面次数X。
重复实验：同样至少重复100组，减少随机误差，记录X=0、1、2的出现次数。
计算频率：用“出现次数÷总组数”得到各取值的频率，对比理论概率。

实验记录与分析

理论概率与实验频率（示例：100组）

正面次数X	理论概率（PMF）	实验出现次数	实验频率
0	0.3×0.3=0.09	10	0.10
1	2×0.7×0.3=0.42	41	0.41
2	0.7×0.7=0.49	49	0.49

对应PMF与分布特征：
真实PMF为 $\binom{2}{x} 0.7^x 0.3^{2-x}$ （二项分布公式）
绘制柱状图时：
X=2的柱子最高（概率0.49），X=1次之（0.42），X=0最低（0.09）；
分布整体向“取值更大的X=2”倾斜，呈现右偏分布，直观体现了“硬币正面概率高”的偏倚特性。

均匀分布实验：掷公平骰子，观察“朝上点数”的分布

实验目的

验证当随机变量的所有可能取值“概率完全相等”时，分布呈“水平均匀”形态，即均匀分布。

实验材料

1枚公平骰子（6个面分别标有1~6点，材质均匀，每个面朝上的概率均为1/6）；
记录纸、笔（或电子表格）。

实验步骤

随机变量定义：设定X为“掷一次骰子后朝上的点数”，可能取值为1、2、3、4、5、6（共6个离散值）。
单次实验操作：将骰子放在手心摇晃后掷出，待稳定后记录朝上的点数X。
重复实验：均匀分布的随机误差更明显，建议至少重复120次（即掷120次骰子，确保每个取值的出现次数足够多），记录每次的X值。
计算频率：统计X=1~6的出现次数，用“出现次数÷总掷数”得到频率，逼近1/6的理论概率。

实验记录与分析

记录表格（示例：120次实验）

点数X	出现次数	频率（≈概率）
1	21	0.175（≈1/6≈0.167）
2	19	0.158
3	20	0.167
4	22	0.183
5	18	0.150
6	20	0.167

对应PMF与分布特征：
真实PMF为 $p(x)={1/6,x=1,2,...,60,其他p(x)=\begin{cases}1/6, & x=1,2,...,6 \\ 0, & 其他\end{cases}$
绘制柱状图时：
横轴为X=1~6，纵轴为频率/概率；
6个柱子的高度基本一致（均接近1/6），呈水平直线状，完美体现“均匀分布”中“各取值概率相等”的核心特征。

四、简单的说概率质量函数（Probability Mass Function, 简称PMF）

简单说，概率质量函数（Probability Mass Function, PMF）就是给“能一个个数出来的随机结果”，挨个标上“它发生的概率是多少”的“清单”——只不过这个清单是用函数的形式写的
为什么叫“质量函数”？这是从物理学借来的比喻。想象每个取值x是一个点，在这个点上有一个“质量”（概率），所有质量加起来是1，就像总质量为1的物体。概率就像质量一样“集中”在离散的点上。

抛两次公平的硬币，想知道“正面出现的次数”，定X为“抛两次硬币后出现的正面次数”，则X的可能取值为：0（两次全反）、1（一正一反）、2（两次全正）（这个“次数”就是“离散随机变量”，因为它只能是0、1、2这三个能数出来的数）。

正面0次（两次都是反面）的概率是1/4；
正面1次的概率是1/2；
正面2次的概率是1/4；
除此之外（比如正面3次），概率都是0。

把这些“结果→概率”的对应关系写成一个“规则”，就是PMF。它本质上在回答一个问题：“当这个随机变量取某个具体值时，概率到底是多少？”

那为啥要搞概率质量函数 PMF，直接列个表格不行吗？
表格能看，但不好“算”。比如想算“平均能出几次正面”（期望值），或者“正面次数不超过1次的概率”（累积概率），有了PMF这个“函数规则”，就能直接套公式算——不用每次都翻表格、一个个加，效率高多了。

五、用数学的方式说概率质量函数（Probability Mass Function, 简称PMF）

设随机试验的样本空间为 $Ω\Omega$ ， $\Omega \to \mathbb{R}$ 是定义在样本空间上的离散型随机变量（即 $X$ 的所有可能取值构成的集合是可数集，记为 $\{x_1, x_2, \dots, x_n, \dots\}$ ，称为 $X$ 的“支撑集”）。

若函数 $pX:R→[0,1]p_X: \mathbb{R} \to [0, 1]$ 满足以下两个条件：

非负性：对任意 $\in \mathbb{R}$ ，都有 $pX(x)≥0p_X(x) \geq 0$ ；
归一性（总概率为1）：对 $X$ 的所有可能取值求和，满足 $∑x∈SpX(x)=1\sum_{x \in S} p_X(x) = 1$ ；
概率对应性：对任意 $\in S$ ， $p_X(x) = P(X = x)$ （即函数值等于随机变量 $X$ 取该值的概率）；且对任意 $\notin S$ ， $p_X(x) = 0$ （即随机变量不可能取到的值，其概率质量为0）。

则称函数 $p_X(x)$ 为离散型随机变量 $X$ 的概率质量函数。

补充：

PMF的本质是离散型随机变量“取值-概率”对应关系的函数化表示，它将“随机变量取某个特定值的概率”转化为一个定义域为实数集、值域为 $[0, 1]$ 的函数，且仅在随机变量的可能取值点上有非零值。
两个条件（非负性、归一性）是PMF的“合法性约束”——任何不满足这两个条件的函数，都不能称为某离散型随机变量的PMF。
符号 $p_X(x)$ 中的下标 $X$ 用于明确“该函数对应哪个随机变量”（当存在多个随机变量时可避免混淆），通常在上下文明确时可简写为 $p (x)$ 。