对泊松过程的理解
泊松过程用以描述一段时间内事件的发生次数的概率

根据公式,当取的时间区间不同时,对同一个发生次数k,所获得的概率P是不一样的。
这是显而易见的,所取的时间区间越大,在该区间内时间可能发生的次数越多,发生相同次数时的概率越大
注意,这里只是可能,是一种概率或推测。实际上,后面所取的时间区间是前面的两倍,真实发生的事件次数仍可能相同
泊松分布用于描述单位时间内随机事件发生次数的概率分布

对比可知,泊松过程和泊松过程的具有相同的函数表示形式,所不同的地方在于时间选取。
泊松过程是一段时间,泊松分布是单位时间
一段时间可由多个单位时间组成,每个单位时间的事件发生次数都有各自的泊松分布,但总的时间段内事件发生次数是泊松过程,他们有相同的函数形式,但函数的参数λ的值不同
在泊松过程中,到达率λ为一段时间内发生的事件数/时间
通常对于给定问题,事件数和时间是已知的,我们会做各种条件假设,认为其符合泊松过程
根据已知的事件数和时间,可以计算出到达率,也即事件发生的速率,其倒数为事件的发生的平均时间
当选择特定时间段时,(事件数/时间)*时间段即为泊松分布中的预期事件数λ
时间段可以自定义修改,于是对不同的时间段,λ是不同的
因此,用事件发生速率*时间段就得到在该时间段内预期的事件数
注意,这并不表示该时间段内实际发生的事件数为λ,但其表示出现λ次的概率最大
此外,还可以通过更改事件数/时间来改变λ,对应到实际问题是,选择不同时间段内的发生事件次数得到一个更为精准的速率。
泊松过程通常有如下的性质:
-
每个事件发生的概率在单位时间内是恒定的,即不同单位时间内泊松分布的参数值相同(即同分布)
- 单位时间内事件只能发生一次,单位时间内事件发生符合伯努利试验,我们需要尽可能选择小的单位时间来保证这一点,这意味着很多单位时间内事件是不会发生的,即单位时间内事件的发生是低概率的
- 不同事件之间彼此独立,即一个事件是否发生与另一个事件无关
- 两次事件发生的间隔服从指数分布
如果一个计数过程的到达间隔序列是相互独立同分布,其分布是参数为λ的指数分布,则该过程是到达率为λ的泊松过程
通常我们会统计现有数据,即时间段和事件次数是已有的,且事件是小概率发生的,假定事件独立且同分布,其符合泊松过程
用泊松过程做计算与现有数据对比,在容许的误差范围内,认为该假设合理,就可以用该泊松过程函数做预测
(以上都表示时间区间,换成空间区间也是可以的)
【问题实例——交通事故】
某条主干路线上发生每天发生的交通事故数量有一系列的统计,根据一段时间内的历史数据,假设平均每天发生10起
将单位时间选择为1小时,可能发现在某一时刻发生了两次交通事故,且在一个小时内发生的交通事故的速率为:10/24 = 0.42,很高,不符合泊松过程的基本假设
将单位时间选择为1分钟,基本不可能在1分钟内发生了多次交通事故,且在1分钟内发生的交通事故的速率为:10/(24*60) = 0.0069,很低,符合泊松过程的基本假设
同时,我们默认上一起交通事故对下一次交通事故没有影响,相互独立
默认,事故率在观测周期内保持稳定
选择时间段为一个小时,则可以得到泊松分布中的λ= 10/(24*60)* 60 = 0.42。
据此可以计算一个小时不同事故次数的概率,与已有的数据的概率做对比,或转为具体次数做对比。
如果要预估某一天的事故数量,那么需要根据当年的历史数据做估算。
【参考】
https://blog.csdn.net/wang136958280/article/details/102924384
https://zhuanlan.zhihu.com/p/146726798
