概率论与数理统计核心知识点与公式总结(就业版)
文章目录
- 概率论与数理统计核心知识点与公式总结(附实际应用)
- 一、概率论基础
- 1.1 基本概念
- 1.2 条件概率与独立性
- 二、随机变量及其分布
- 2.0 随机变量
- 2.0 分布函数(CDF)
- 2.1 离散型随机变量
- 2.2 连续型随机变量
- 2.3 多维随机变量
- 2.3.1 联合分布
- 2.3.2 边缘分布
- 2.3.3 条件分布
- 2.3.4 独立性判断
- 三、数字特征
- 3.1 期望(均值)🌟🌟🌟🌟
- 3.2 方差与标准差
- 3.3 协方差与相关系数
- 四、大数定律与中心极限定理
- 4.1 大数定律
- 4.1 大数定律(辛钦)
- 4.2 中心极限定理(CLT)
- 4.3 切比雪夫不等式
- 五、数理统计基础
- 5.1 抽样分布
- 5.2 参数估计
- 六、假设检验
- 6.1 检验步骤
- 6.2 常见检验方法
- 七、回归分析
- 7.1 一元线性回归
- 八、其他常用公式
- 1. 协方差矩阵
- 2. 标准化公式(Z分数)
- 九、实际应用案例
- 案例1:正态分布在数据分析中的应用
- 案例2:假设检验在A/B测试中的应用
概率论与数理统计核心知识点与公式总结(附实际应用)
一、概率论基础
1.1 基本概念
-
样本空间(Ω)
所有可能结果的集合,例如掷骰子的样本空间为 Ω = { 1 , 2 , 3 , 4 , 5 , 6 } \Omega = \{1,2,3,4,5,6\} Ω={1,2,3,4,5,6}。 -
概率公理
- 非负性: P ( A ) ≥ 0 P(A) \geq 0 P(A)≥0
- 规范性: P ( Ω ) = 1 P(\Omega) = 1 P(Ω)=1
- 可列可加性:若
A
i
A_i
Ai事件两两互斥,则
P ( ⋃ i = 1 ∞ A i ) = ∑ i = 1 ∞ P ( A i ) P\left(\bigcup_{i=1}^\infty A_i\right) = \sum_{i=1}^\infty P(A_i) P(i=1⋃∞Ai)=i=1∑∞P(Ai)
-
事件:样本空间的子集,记为 A , B A, B A,B 等。
-
基本事件:只含一个结果的事件。
-
必然事件:一定发生, A = Ω A = \Omega A=Ω。
-
不可能事件:不会发生, A = ∅ A = \varnothing A=∅。
-
互斥事件: A ∩ B = ∅ A \cap B = \varnothing A∩B=∅。
-
古典概率
P ( A ) = 事件A包含的基本事件个数 样本空间中基本事件总数 P(A) = \frac{\text{事件A包含的基本事件个数}}{\text{样本空间中基本事件总数}} P(A)=样本空间中基本事件总数事件A包含的基本事件个数
前提:所有基本事件等可能发生
1.2 条件概率与独立性
-
条件概率公式 🌟🌟🌟🌟
P ( B ∣ A ) = P ( A ∩ B ) P ( A ) ( 要求 P ( A ) > 0 ) P(B|A) = \frac{P(A \cap B)}{P(A)} \quad (\text{要求 } P(A) > 0) P(B∣A)=P(A)P(A∩B)(要求 P(A)>0) -
全概率公式(完备事件组)
若事件 { B i } \{B_i\} {Bi} 是样本空间的划分(互斥且全覆盖),则:
P ( A ) = ∑ i = 1 n P ( B i ) ⋅ P ( A ∣ B i ) P(A) = \sum_{i=1}^{n} P(B_i) \cdot P(A|B_i) P(A)=i=1∑nP(Bi)⋅P(A∣Bi) -
贝叶斯定理 🌟🌟
P ( B i ∣ A ) = P ( B i ) ⋅ P ( A ∣ B i ) ∑ j = 1 n P ( B j ) ⋅ P ( A ∣ B j ) P(B_i|A) = \frac{P(B_i) \cdot P(A|B_i)}{\sum_{j=1}^{n} P(B_j) \cdot P(A|B_j)} P(Bi∣A)=∑j=1nP(Bj)⋅P(A∣Bj)P(Bi)⋅P(A∣Bi) -
独立事件 🌟🌟🌟🌟
若 P ( A ∩ B ) = P ( A ) P ( B ) P(A \cap B) = P(A)P(B) P(A∩B)=P(A)P(B),则称事件 A A A 和 B B B 独立。
事件 A A A 与 B B B 独立当且仅当:
P ( A ∩ B ) = P ( A ) ⋅ P ( B ) P(A \cap B) = P(A) \cdot P(B) P(A∩B)=P(A)⋅P(B) -
乘法公式🌟🌟🌟🌟
P ( A ∩ B ) = P ( B ) ⋅ P ( A ∣ B ) P(A \cap B) = P(B) \cdot P(A|B) P(A∩B)=P(B)⋅P(A∣B)
二、随机变量及其分布
2.0 随机变量
- 离散型:取有限或可数个值
- 连续型:在某区间内取无限多个值
2.0 分布函数(CDF)
F ( x ) = P ( X ≤ x ) F(x) = P(X \leq x) F(x)=P(X≤x)
性质:右连续,单调不减, 0 ≤ F ( x ) ≤ 1 0 \le F(x) \le 1 0≤F(x)≤1
2.1 离散型随机变量
-
分布律
P ( X = x i ) = p i P(X = x_i) = p_i P(X=xi)=pi,满足 ∑ p i = 1 \sum p_i = 1 ∑pi=1。 -
常见分布
-
二项分布 B ( n , p ) B(n, p) B(n,p)
描述 n n n 次独立重复试验的成功次数:
P ( X = k ) = C n k p k ( 1 − p ) n − k P(X = k) = C_n^k p^k (1-p)^{n-k} P(X=k)=Cnkpk(1−p)n−k
应用场景:产品质检中的合格品数量预测。 -
泊松分布 P ( λ ) P(\lambda) P(λ)
描述单位时间内事件发生的次数:
P ( X = k ) = λ k e − λ k ! P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!} P(X=k)=k!λke−λ
应用场景:客服中心每小时接到的电话数。
-
-
离散型分布🌟🌟
分布 | 参数 | 概率质量函数 P ( X = x ) P(X=x) P(X=x) | 期望 E ( X ) E(X) E(X) | 方差 D ( X ) D(X) D(X) |
---|---|---|---|---|
0-1分布 | p p p | P ( 1 ) = p , P ( 0 ) = 1 − p P(1)=p,\ P(0)=1-p P(1)=p, P(0)=1−p | p p p | p ( 1 − p ) p(1-p) p(1−p) |
二项分布 | n , p n,p n,p | P ( k ) = ( n k ) p k ( 1 − p ) n − k P(k)=\binom{n}{k}p^k(1-p)^{n-k} P(k)=(kn)pk(1−p)n−k | n p np np | n p ( 1 − p ) np(1-p) np(1−p) |
几何分布 | p p p | P ( k ) = ( 1 − p ) k − 1 p P(k)=(1-p)^{k-1}p P(k)=(1−p)k−1p | 1 p \frac{1}{p} p1 | 1 − p p 2 \frac{1-p}{p^2} p21−p |
泊松分布 | λ \lambda λ | P ( k ) = λ k e − λ k ! P(k)=\frac{\lambda^k e^{-\lambda}}{k!} P(k)=k!λke−λ | λ \lambda λ | λ \lambda λ |
2.2 连续型随机变量
-
概率密度函数(PDF)
f ( x ) ≥ 0 f(x) \geq 0 f(x)≥0,且 ∫ − ∞ + ∞ f ( x ) d x = 1 \int_{-\infty}^{+\infty} f(x)dx = 1 ∫−∞+∞f(x)dx=1。 -
常见分布 🌟🌟
-
正态分布 N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2)
f ( x ) = 1 σ 2 π e − ( x − μ ) 2 2 σ 2 f(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}} f(x)=σ2π1e−2σ2(x−μ)2
应用场景:学生考试成绩分布。 -
指数分布 E x p ( λ ) Exp(\lambda) Exp(λ)
f ( x ) = λ e − λ x ( x ≥ 0 ) f(x) = \lambda e^{-\lambda x} \quad (x \geq 0) f(x)=λe−λx(x≥0)
应用场景:电子元件的寿命建模。
-
-
连续型分布
分布 | 参数 | 密度函数 f ( x ) f(x) f(x) | 期望 E ( X ) E(X) E(X) | 方差 D ( X ) D(X) D(X) |
---|---|---|---|---|
均匀分布 | a , b a,b a,b | f ( x ) = 1 b − a f(x)=\frac{1}{b-a} f(x)=b−a1, x ∈ [ a , b ] x\in[a,b] x∈[a,b] | a + b 2 \frac{a+b}{2} 2a+b | ( b − a ) 2 12 \frac{(b-a)^2}{12} 12(b−a)2 |
指数分布 | λ \lambda λ | f ( x ) = λ e − λ x f(x)=\lambda e^{-\lambda x} f(x)=λe−λx, x ≥ 0 x\ge0 x≥0 | 1 λ \frac{1}{\lambda} λ1 | 1 λ 2 \frac{1}{\lambda^2} λ21 |
正态分布 | μ , σ 2 \mu,\sigma^2 μ,σ2 | f ( x ) = 1 2 π σ 2 e − ( x − μ ) 2 2 σ 2 f(x)=\frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{(x-\mu)^2}{2\sigma^2}} f(x)=2πσ21e−2σ2(x−μ)2 | μ \mu μ | σ 2 \sigma^2 σ2 |
2.3 多维随机变量
2.3.1 联合分布
- 联合分布函数: F ( x , y ) = P ( X ≤ x , Y ≤ y ) F(x, y) = P(X \le x, Y \le y) F(x,y)=P(X≤x,Y≤y)
- 联合密度函数: f ( x , y ) f(x, y) f(x,y)(连续)或 P ( X = x , Y = y ) P(X=x, Y=y) P(X=x,Y=y)(离散)
2.3.2 边缘分布
f X ( x ) = ∫ − ∞ ∞ f ( x , y ) d y , f Y ( y ) = ∫ − ∞ ∞ f ( x , y ) d x f_X(x) = \int_{-\infty}^{\infty} f(x, y)dy,\quad f_Y(y) = \int_{-\infty}^{\infty} f(x, y)dx fX(x)=∫−∞∞f(x,y)dy,fY(y)=∫−∞∞f(x,y)dx
2.3.3 条件分布
- 条件密度: f Y ∣ X ( y ∣ x ) = f ( x , y ) f X ( x ) f_{Y|X}(y|x) = \frac{f(x,y)}{f_X(x)} fY∣X(y∣x)=fX(x)f(x,y)
2.3.4 独立性判断
若 f ( x , y ) = f X ( x ) ⋅ f Y ( y ) f(x,y) = f_X(x) \cdot f_Y(y) f(x,y)=fX(x)⋅fY(y),则 X X X 与 Y Y Y 独立。
三、数字特征
3.1 期望(均值)🌟🌟🌟🌟
-
定义
离散型: E ( X ) = ∑ x i P ( X = x i ) E(X) = \sum x_i P(X=x_i) E(X)=∑xiP(X=xi)
连续型: E ( X ) = ∫ − ∞ + ∞ x f ( x ) d x E(X) = \int_{-\infty}^{+\infty} x f(x)dx E(X)=∫−∞+∞xf(x)dx -
线性性质 🌟🌟
E ( a X + b ) = a E ( X ) + b E(aX + b) = aE(X) + b E(aX+b)=aE(X)+b
3.2 方差与标准差
-
方差 🌟🌟🌟🌟🌟🌟
D ( X ) = E [ ( X − E ( X ) ) 2 ] = E ( X 2 ) − [ E ( X ) ] 2 D(X) = E[(X - E(X))^2] = E(X^2) - [E(X)]^2 D(X)=E[(X−E(X))2]=E(X2)−[E(X)]2 -
标准差
σ X = D ( X ) \sigma_X = \sqrt{D(X)} σX=D(X) -
性质
D ( a X + b ) = a 2 D ( X ) D(aX + b) = a^2D(X) D(aX+b)=a2D(X)
3.3 协方差与相关系数
- 协方差:
C o v ( X , Y ) = E [ ( X − E ( X ) ) ( Y − E ( Y ) ) ] \mathrm{Cov}(X,Y) = E[(X - E(X))(Y - E(Y))] Cov(X,Y)=E[(X−E(X))(Y−E(Y))] - 相关系数:
ρ X Y = C o v ( X , Y ) D ( X ) ⋅ D ( Y ) \rho_{XY} = \frac{\mathrm{Cov}(X,Y)}{\sqrt{D(X)} \cdot \sqrt{D(Y)}} ρXY=D(X)⋅D(Y)Cov(X,Y)
四、大数定律与中心极限定理
4.1 大数定律
- 弱大数定律
样本均值依概率收敛于期望:
1 n ∑ i = 1 n X i → P μ ( n → ∞ ) \frac{1}{n}\sum_{i=1}^n X_i \xrightarrow{P} \mu \quad (n \to \infty) n1i=1∑nXiPμ(n→∞)
4.1 大数定律(辛钦)
设
X
1
,
.
.
.
,
X
n
X_1, ..., X_n
X1,...,Xn 独立同分布,
E
(
X
i
)
=
μ
E(X_i)=\mu
E(Xi)=μ,则:
X
‾
n
=
1
n
∑
i
=
1
n
X
i
→
P
μ
\overline{X}_n = \frac{1}{n} \sum_{i=1}^n X_i \xrightarrow{P} \mu
Xn=n1i=1∑nXiPμ
4.2 中心极限定理(CLT)
- 核心结论
独立同分布随机变量的和近似正态分布,设 X i X_i Xi 独立同分布, E ( X i ) = μ , D ( X i ) = σ 2 E(X_i)=\mu, D(X_i)=\sigma^2 E(Xi)=μ,D(Xi)=σ2,则:
∑ i = 1 n X i − n μ σ n → d N ( 0 , 1 ) \frac{\sum_{i=1}^n X_i - n\mu}{\sigma\sqrt{n}} \xrightarrow{d} N(0, 1) σn∑i=1nXi−nμdN(0,1)
应用场景:民意调查中样本均值的分布。
4.3 切比雪夫不等式
P ( ∣ X − μ ∣ ≥ ε ) ≤ D ( X ) ε 2 P(|X - \mu| \ge \varepsilon) \le \frac{D(X)}{\varepsilon^2} P(∣X−μ∣≥ε)≤ε2D(X)
五、数理统计基础
5.1 抽样分布
-
样本均值
X ˉ = 1 n ∑ i = 1 n X i \bar{X} = \frac{1}{n}\sum_{i=1}^n X_i Xˉ=n1i=1∑nXi -
样本方差
S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ˉ ) 2 S^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \bar{X})^2 S2=n−11i=1∑n(Xi−Xˉ)2 -
样本统计量
-
样本均值: X ‾ = 1 n ∑ X i \overline{X} = \frac{1}{n} \sum X_i X=n1∑Xi
-
样本方差: S 2 = 1 n − 1 ∑ ( X i − X ‾ ) 2 S^2 = \frac{1}{n-1} \sum (X_i - \overline{X})^2 S2=n−11∑(Xi−X)2
-
三大分布
- 卡方分布 χ 2 ( n ) \chi^2(n) χ2(n):若 X i ∼ N ( 0 , 1 ) X_i \sim N(0,1) Xi∼N(0,1),则 ∑ i = 1 n X i 2 ∼ χ 2 ( n ) \sum_{i=1}^n X_i^2 \sim \chi^2(n) ∑i=1nXi2∼χ2(n)
- t分布 t ( n ) t(n) t(n): T = X ˉ − μ S / n ∼ t ( n − 1 ) T = \frac{\bar{X} - \mu}{S/\sqrt{n}} \sim t(n-1) T=S/nXˉ−μ∼t(n−1)
- F分布 F ( m , n ) F(m,n) F(m,n): F = S 1 2 / σ 1 2 S 2 2 / σ 2 2 ∼ F ( m − 1 , n − 1 ) F = \frac{S_1^2 / \sigma_1^2}{S_2^2 / \sigma_2^2} \sim F(m-1, n-1) F=S22/σ22S12/σ12∼F(m−1,n−1)
5.2 参数估计
-
点估计:直接用样本统计量估计总体参数
-
区间估计:构造置信区间估计参数
-
最大似然估计(MLE)
通过最大化似然函数 L ( θ ) = ∏ f ( x i ; θ ) L(\theta) = \prod f(x_i; \theta) L(θ)=∏f(xi;θ) 求解参数。 -
正态总体均值的置信区间
- σ \sigma σ已知: X ˉ ± z α / 2 σ n \bar{X} \pm z_{\alpha/2} \frac{\sigma}{\sqrt{n}} Xˉ±zα/2nσ
- σ \sigma σ未知: X ˉ ± t α / 2 ( n − 1 ) S n \bar{X} \pm t_{\alpha/2}(n-1) \frac{S}{\sqrt{n}} Xˉ±tα/2(n−1)nS
-
点估计
- 矩估计法:用样本矩估计总体矩。
- 最大似然估计(MLE):最大化似然函数 L ( θ ) = ∏ f ( x i ; θ ) L(\theta) = \prod f(x_i; \theta) L(θ)=∏f(xi;θ)。
-
区间估计
- 正态总体均值置信区间(
σ
\sigma
σ已知):
X ˉ ± z α / 2 σ n \bar{X} \pm z_{\alpha/2} \frac{\sigma}{\sqrt{n}} Xˉ±zα/2nσ -
σ
\sigma
σ未知时:
X ˉ ± t α / 2 ( n − 1 ) S n \bar{X} \pm t_{\alpha/2}(n-1) \frac{S}{\sqrt{n}} Xˉ±tα/2(n−1)nS
- 正态总体均值置信区间(
σ
\sigma
σ已知):
六、假设检验
6.1 检验步骤
- 提出原假设 H 0 H_0 H0 和备择假设 H 1 H_1 H1。
- 选择检验统计量(如Z统计量、t统计量)。
- 确定显著性水平 α \alpha α (如 0.05)和拒绝域。
- 求出 P 值或临界值并判断是否拒绝 H 0 H_0 H0,计算p值并得出结论。
6.2 常见检验方法
- Z检验:已知总体方差时使用。
- t检验:小样本且总体方差未知时使用。
- 卡方检验:检验方差或分布拟合优度。
检验类型 | 条件 | 分布 |
---|---|---|
单样本Z检验 | σ \sigma σ已知 | Z ∼ N ( 0 , 1 ) Z \sim N(0,1) Z∼N(0,1) |
单样本t检验 | σ \sigma σ未知 | t ∼ t ( n − 1 ) t \sim t(n-1) t∼t(n−1) |
双样本t检验 | 两正态总体 | t ∼ t ( n 1 + n 2 − 2 ) t \sim t(n_1+n_2-2) t∼t(n1+n2−2) |
卡方检验 | 适配性、独立性检验 | χ 2 \chi^2 χ2 分布 |
七、回归分析
7.1 一元线性回归
-
模型
Y = β 0 + β 1 X + ϵ Y = \beta_0 + \beta_1 X + \epsilon Y=β0+β1X+ϵ -
最小二乘法估计
β ^ 1 = ∑ ( x i − x ˉ ) ( y i − y ˉ ) ∑ ( x i − x ˉ ) 2 , β ^ 0 = y ˉ − β ^ 1 x ˉ \hat{\beta}_1 = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sum (x_i - \bar{x})^2}, \quad \hat{\beta}_0 = \bar{y} - \hat{\beta}_1 \bar{x} β^1=∑(xi−xˉ)2∑(xi−xˉ)(yi−yˉ),β^0=yˉ−β^1xˉ -
Python代码示例
import numpy as np from sklearn.linear_model import LinearRegression X = np.array([1, 2, 3, 4, 5]).reshape(-1, 1) y = np.array([2, 4, 5, 4, 5]) model = LinearRegression().fit(X, y) print(f"斜率: {model.coef_[0]:.2f}, 截距: {model.intercept_:.2f}")
八、其他常用公式
1. 协方差矩阵
Σ = [ D ( X ) C o v ( X , Y ) C o v ( Y , X ) D ( Y ) ] \Sigma = \begin{bmatrix} D(X) & \mathrm{Cov}(X,Y) \\ \mathrm{Cov}(Y,X) & D(Y) \end{bmatrix} Σ=[D(X)Cov(Y,X)Cov(X,Y)D(Y)]
2. 标准化公式(Z分数)
Z = X − μ σ ⇒ Z ∼ N ( 0 , 1 ) Z = \frac{X - \mu}{\sigma} \Rightarrow Z \sim N(0,1) Z=σX−μ⇒Z∼N(0,1)
九、实际应用案例
案例1:正态分布在数据分析中的应用
- 场景:某班级学生身高服从正态分布 ( N(170, 5^2) ),计算身高超过180cm的概率。
Python实现:from scipy.stats import norm prob = 1 - norm.cdf(180, loc=170, scale=5) print(f"概率: {prob:.4f}") # 输出:0.0228
案例2:假设检验在A/B测试中的应用
- 场景:对比新旧页面转化率,使用Z检验判断差异是否显著。