概率论几大分布的由来
在阅读本文章前为大家推荐一篇写的十分通俗易懂的概率密度函数和累积分布函数的入门教程 概率密度函数是概率分布函数求导吗?
https://www.zhihu.com/question/21911186/answer/2300063086
一 分布公式
一、两点分布
“两点分布”是最简单的离散型概率分布之一,又称为0-1分布(Bernoulli 分布),它只有两个可能的取值:例如事件成功(1)或失败(0)。
设随机变量 XXX 的取值只有两个:
-
X=1 表示事件发生(成功)
-
X=0 表示事件不发生(失败)
这种分布称为 两点分布 或 0-1分布。
构造两点分布的统一的公式来表达 X=0和 X=1 时的概率。可以这样写:
这个公式可以说是接下来出现的二项分布,泊松分布,指数分布等的基础
希望大家可以通过记忆,或者推导彻底记住,在这里我给大家一种简单的记忆方法
这里的(1-p)^(1-x)才对
在记忆两点分布的公式后我们尝试解决一下二项分布
二、二项分布
二项分布(Binomial)用于描述:重复进行 n次独立的“成功/失败”实验,每次成功的概率是 p,问恰好出现 k次成功的概率是多少?
这里的 成功/失败 实验其实就是伯努利实验
不废话我们来逐步得到二项分布的公式
假设我们得到了二项分布的公式,会发现里面存在组合数的一些基本知识,我们先快速学习一下:
从排列数推导组合数公式
(1)先算“排列数”——有顺序的选法数
-
先算从 n 个元素里选 k 个,且考虑顺序的情况,这叫做“排列数”:
-
这就是先选第1个有 n 种选法,第2个有 n−1种,依次类推。
(2)消除顺序影响,得到组合数
-
但是你要的是不考虑顺序,
(3)排列数除以重复排列数
-
k个元素可以排出 k! 种顺序,都是同一个组合。(可以画个图很快就理解了)
这个时候基础的知识我们已经掌握的差不多了,可以开始学习推导并记忆一下二项分布了
第一步:固定一种“成功失败排列”
我们假设进行 n 次独立的实验,每次实验:
-
成功的概率是 p
-
失败的概率是 1−p
我们现在来求:恰好有 k次成功的概率。
第二步:有多少种这样的排列?
要在 n 次中选出 k 次成功,有:种不同的排列方式。
第三步:总概率 = 方式数 × 每种方式的概率
举个小例子理解一下即可
三、泊松分布
泊松分布可以看作是二项分布在某种极限情况下的近似。
泊松分布描述的是:
单位时间/单位空间内某个“稀有事件”发生的次数。
它适用于如下情景:
-
某网站平均每分钟有 2 次访问(单位时间)
-
每公里路上平均有 0.3 次车祸(单位空间)
-
每页书上平均有 1 个错字
如果每个小时间段是否发生事件互不影响(独立),而每段中事件发生的概率为 那么整段时间内事件发生次数 X 服从:
四、指数分布
指数分布我们先给出它的表达式
指数分布描述的是「等下一个事件到来」要等多久。
而泊松分布是:
单位时间内,会发生几次事件?
所以:
泊松:看“个数”
指数:看“时间”
两者正好互为镜像:
指数分布 = 泊松过程中第一个事件出现的时间间隔的分布。
五、均匀分布
在某个确定的区间 [a, b]
内,每一个可能的结果出现的概率都是完全相等的。区间外的概率为0。
六、正态分布
二、期望和方差
我们先大概扫一眼常见分布的期望和方差,学到最后这些都需要背下来