当前位置: 首页 > news >正文

概率质量/密度函数、累计分布函数详解

1 随机变量是什么

随机变量XXX:本质是一个函数,把“试验结果”映射为数值。
但光有XXX还不够,我们要知道 它的取值有多大概率出现
于是引入 分布函数 来描述随机变量的规律。

2 概率质量函数(Probability Mass Function, PMF)

定义

适用于离散随机变量pX(x)=P(X=x)p_X(x)=\mathbb{P}(X=x)pX(x)=P(X=x)
表示随机变量 XXX 取值为 xxx 的概率。

名字由来

Mass(质量):概率在某些点上集中,就像一堆沙子放在离散的点上。
每个点都有一个“概率质量”,所有点的质量加起来 = 1。

性质

非负pX(x)≥0p_X(x)\ge 0pX(x)0
归一化∑xpX(x)=1\sum_{x} p_X(x)=1xpX(x)=1

作用

完全描述一个离散随机变量的分布
计算概率:P(X∈A)=∑x∈ApX(x)\mathbb{P}(X\in A)=\sum_{x\in A}p_X(x)P(XA)=xApX(x)
计算期望:E[X]=∑xx,pX(x)\mathbb{E}[X]=\sum_x x,p_X(x)E[X]=xx,pX(x)

3.概率密度函数(Probability Density Function,PDF)

定义

适用于连续随机变量
P(a≤X≤b)=∫abfX(x)dx\mathbb{P}(a \leq X \leq b) = \int_a^b f_X(x)dxP(aXb)=abfX(x)dx

名字由来

Density(密度):概率像“涂抹在一条线上”,不是集中在某点。
f(x)f(x)f(x) 不是概率,而是概率密度,积分才是概率。(物理上m=ρvm=\rho vm=ρv

性质

非负fX(x)≥0f_X(x)\ge 0fX(x)0
归一化∫−∞∞fX(x),dx=1\int_{-\infty}^{\infty} f_X(x),dx = 1fX(x),dx=1

作用

完全描述一个连续随机变量的分布
区间概率:P(a≤X≤b)=∫abf(x),dx\mathbb{P}(a\le X\le b)=\int_a^b f(x),dxP(aXb)=abf(x),dx
期望:E[X]=∫−∞∞xf(x),dx\mathbb{E}[X]=\int_{-\infty}^{\infty} x f(x),dxE[X]=xf(x),dx

4.累积分布函数(Cumulative Distribution Function,CDF)

定义

适用于所有随机变量(离散/连续/混合)
FX(x)=(X≤x)F_X(x)=\mathbb(X \leq x)FX(x)=(Xx)

名字由来

Cumulative(累积):从 −∞-\inftyxxx,把所有概率加起来。
离散时是台阶函数;连续时是平滑曲线。

性质

单调不减
边界条件lim⁡x→−∞F(x)=0,limx→∞F(x)=1\lim_{x\to -\infty}F(x)=0,lim_{x\to\infty}F(x)=1limxF(x)=0,limxF(x)=1
离散:跳跃高度 = PMF
连续:导数 = PDF

作用

统一描述所有分布
概率计算:P(a<X≤b)=F(b)−F(a)\mathbb{P}(a<X\le b)=F(b)-F(a)P(a<Xb)=F(b)F(a)
采样:逆变换法,U∼Uniform(0,1)U\sim \text{Uniform}(0,1)UUniform(0,1),取 X=F−1(U)X=F^{-1}(U)X=F1(U)

5.三者关系总结

PMF:点上的概率大小(只适合离散)
PDF:点上的概率密度(积分才是概率,适合连续)
CDF:累计概率,适合所有随机变量
离散:p(x)=P(X=x),F(x)=∑t≤xp(t)p(x)=\mathbb{P}(X=x),F(x)=\sum_{t \le x}p(t)p(x)=P(X=x),F(x)=txp(t)
连续:f(x)=ddxF(x),F(x)=∫−∞xf(t)dtf(x)=\frac{d}{dx}F(x),F(x)=\int_{-\infty}^xf(t)dtf(x)=dxdF(x),F(x)=xf(t)dt


文章转载自:

http://o6NBmOpJ.cyyhy.cn
http://0vsTn6kI.cyyhy.cn
http://ULtEEp5B.cyyhy.cn
http://P7qaYJis.cyyhy.cn
http://rN32oy4K.cyyhy.cn
http://CmJJUniL.cyyhy.cn
http://4Xyc1eha.cyyhy.cn
http://mDKxG2IE.cyyhy.cn
http://GCvrR9uh.cyyhy.cn
http://YcW6hx3B.cyyhy.cn
http://VcjDG59m.cyyhy.cn
http://meNmiNjS.cyyhy.cn
http://Z9clSBpd.cyyhy.cn
http://t9guqrjH.cyyhy.cn
http://Uh8w0Zfl.cyyhy.cn
http://dgxMEhdr.cyyhy.cn
http://T5kiidEU.cyyhy.cn
http://DQ27oNnx.cyyhy.cn
http://tHeoEoFA.cyyhy.cn
http://yg70aDXF.cyyhy.cn
http://bYNaR2IZ.cyyhy.cn
http://HtrJhnFq.cyyhy.cn
http://ytrNTsW5.cyyhy.cn
http://m7KV1fcy.cyyhy.cn
http://7oXuw6NY.cyyhy.cn
http://xipMmiAT.cyyhy.cn
http://SQl3y0Bp.cyyhy.cn
http://YHF8KCvY.cyyhy.cn
http://WNqs5Pu6.cyyhy.cn
http://EJX5YbXP.cyyhy.cn
http://www.dtcms.com/a/364730.html

相关文章:

  • spring boot autoconfigure 自动配置的类,和手工 @configuration + @bean 本质区别
  • 基于 STM32N6-AI Image Classification 使用 git bash 命令行示例 LAT1552
  • Qt读写Excel--QXlsx基本使用
  • 从零构建Linux Shell解释器深入理解Bash进程创建机制
  • mysqldump导出远程的数据库表(在java代码中实现)
  • 机器学习进阶,一文搞定模型选型!
  • PPI网络与TF-miRNA调控网络的实现方法(基于《列腺癌研究.pdf》)
  • 亚马逊ASIN定位广告想爆单?先搞懂流量逻辑!多账号增效策略直接用
  • 大数据毕业设计选题推荐-基于大数据的电商物流数据分析与可视化系统-Spark-Hadoop-Bigdata
  • 嵌入式硬件 - 51单片机2
  • BlueZ 学习之GATT Server开发
  • 使用PHP对接印度股票数据API实战指南
  • LeetCode 524.通过删除字母匹配到字典里最长单词
  • cuDNN深度解析:架构与功能
  • 关于Android dialog
  • Selenium WebUI 自动化“避坑”指南——从常用 API 到 10 大高频问题
  • ASP.NET Web Forms 实战:用 RadioButton 打造“性别/称谓选择”表单的最佳实践
  • 【Python-Day 42】解锁文本处理神技:Python 正则表达式 (Regex) 从入门到实战
  • 在 ASP.NET 8 WebAPI 中使用不同的提供程序验证多个令牌(Token)及常见问题解答
  • 前端开发基础必备——操作系统、计网、数据结构与算法编译原理
  • SpringBoot Web 入门指南:从零搭建第一个SpringBoot程序
  • [TryHackMe]Oh My WebServer(nday漏洞+容器逃逸)
  • Archlinux KDE 下 Fcitx5 输入法的配置与美化
  • 重新测试所有AI代码生成器(2025年更新):GPT-5 vs Claude 4.1 vs Gemini 2.5 Pro——为何“赢家”仍取决于你的技术栈
  • 一文掌握Redisson分布式锁
  • 天然苏打水生产的原水抽取与三重除菌的3D模拟开发实战
  • 编辑器vim(Linux)
  • Chrome 插件开发入门:从基础到实践
  • 美团龙猫AI修正的二分法提取xlsx的sheet.xml某个范围的数据到csv文件的C程序
  • 美团龙猫利用expat库实现的保存xml指定范围数据到csv的C程序