人工智能之数学基础:透过频率直方图理解概率密度函数
本文重点
在之前的课程中我们学习了离散型的随机变量,我们开始学习连续型随机变量,在学习连续型随机变量之前,我们先来了解一下概率直方图和概率密度曲线
频率直方图
现在有一个工厂生产一个器件,生产的零部件存在误差,现在生产了100个器件,这100个器件的长度如上所示,其中最小值是128,最大值是155,现在我们将这个数据以频率直方图的方式来显示
频率直方图作图三步曲:
- 确定作图区间 [a, b]
- 确定数据分组数m
- 计算落入各子区间内数据的频数和频率
- 以子区间 [ti-1,ti]为底,yi = fi/d(频率除以组距)为高 ( i=1,2, …, m) 做了一系列小矩形
第一步,a = 数据最小值-ε / 2,b = 数据最大值+ε / 2,ε 是数据的精度
第二步,确定数据分组数 m ,组距 d = (b − a) / m ,各子区间端点ti=a+id,(i = 0, 1, · · · , m)
第三步,计算落入各子区间内数据的频数和频率(频数等于落入子区间的样本数,频率等于落入子区间的