当前位置: 首页 > news >正文

概率论与数理统计核心知识点与公式总结(就业版)

文章目录

  • 概率论与数理统计核心知识点与公式总结(附实际应用)
    • 一、概率论基础
      • 1.1 基本概念
      • 1.2 条件概率与独立性
    • 二、随机变量及其分布
      • 2.0 随机变量
      • 2.0 分布函数(CDF)
      • 2.1 离散型随机变量
      • 2.2 连续型随机变量
      • 2.3 多维随机变量
        • 2.3.1 联合分布
        • 2.3.2 边缘分布
        • 2.3.3 条件分布
        • 2.3.4 独立性判断
    • 三、数字特征
      • 3.1 期望(均值)🌟🌟🌟🌟
      • 3.2 方差与标准差
      • 3.3 协方差与相关系数
    • 四、大数定律与中心极限定理
      • 4.1 大数定律
      • 4.1 大数定律(辛钦)
      • 4.2 中心极限定理(CLT)
      • 4.3 切比雪夫不等式
    • 五、数理统计基础
      • 5.1 抽样分布
      • 5.2 参数估计
    • 六、假设检验
      • 6.1 检验步骤
      • 6.2 常见检验方法
    • 七、回归分析
      • 7.1 一元线性回归
    • 八、其他常用公式
      • 1. 协方差矩阵
      • 2. 标准化公式(Z分数)
    • 九、实际应用案例
      • 案例1:正态分布在数据分析中的应用
      • 案例2:假设检验在A/B测试中的应用

概率论与数理统计核心知识点与公式总结(附实际应用)


一、概率论基础

1.1 基本概念

  • 样本空间(Ω)
    所有可能结果的集合,例如掷骰子的样本空间为 Ω = { 1 , 2 , 3 , 4 , 5 , 6 } \Omega = \{1,2,3,4,5,6\} Ω={1,2,3,4,5,6}

  • 概率公理

    • 非负性: P ( A ) ≥ 0 P(A) \geq 0 P(A)0
    • 规范性: P ( Ω ) = 1 P(\Omega) = 1 P(Ω)=1
    • 可列可加性:若 A i A_i Ai事件两两互斥,则
      P ( ⋃ i = 1 ∞ A i ) = ∑ i = 1 ∞ P ( A i ) P\left(\bigcup_{i=1}^\infty A_i\right) = \sum_{i=1}^\infty P(A_i) P(i=1Ai)=i=1P(Ai)
  • 事件:样本空间的子集,记为 A , B A, B A,B 等。

  • 基本事件:只含一个结果的事件。

  • 必然事件:一定发生, A = Ω A = \Omega A=Ω

  • 不可能事件:不会发生, A = ∅ A = \varnothing A=

  • 互斥事件 A ∩ B = ∅ A \cap B = \varnothing AB=

  • 古典概率
    P ( A ) = 事件A包含的基本事件个数 样本空间中基本事件总数 P(A) = \frac{\text{事件A包含的基本事件个数}}{\text{样本空间中基本事件总数}} P(A)=样本空间中基本事件总数事件A包含的基本事件个数

前提:所有基本事件等可能发生


1.2 条件概率与独立性

  • 条件概率公式 🌟🌟🌟🌟
    P ( B ∣ A ) = P ( A ∩ B ) P ( A ) ( 要求  P ( A ) > 0 ) P(B|A) = \frac{P(A \cap B)}{P(A)} \quad (\text{要求 } P(A) > 0) P(BA)=P(A)P(AB)(要求 P(A)>0)

  • 全概率公式(完备事件组)
    若事件 { B i } \{B_i\} {Bi} 是样本空间的划分(互斥且全覆盖),则:
    P ( A ) = ∑ i = 1 n P ( B i ) ⋅ P ( A ∣ B i ) P(A) = \sum_{i=1}^{n} P(B_i) \cdot P(A|B_i) P(A)=i=1nP(Bi)P(ABi)

  • 贝叶斯定理 🌟🌟
    P ( B i ∣ A ) = P ( B i ) ⋅ P ( A ∣ B i ) ∑ j = 1 n P ( B j ) ⋅ P ( A ∣ B j ) P(B_i|A) = \frac{P(B_i) \cdot P(A|B_i)}{\sum_{j=1}^{n} P(B_j) \cdot P(A|B_j)} P(BiA)=j=1nP(Bj)P(ABj)P(Bi)P(ABi)

  • 独立事件 🌟🌟🌟🌟
    P ( A ∩ B ) = P ( A ) P ( B ) P(A \cap B) = P(A)P(B) P(AB)=P(A)P(B),则称事件 A A A B B B 独立。
    事件 A A A B B B 独立当且仅当:
    P ( A ∩ B ) = P ( A ) ⋅ P ( B ) P(A \cap B) = P(A) \cdot P(B) P(AB)=P(A)P(B)

  • 乘法公式🌟🌟🌟🌟
    P ( A ∩ B ) = P ( B ) ⋅ P ( A ∣ B ) P(A \cap B) = P(B) \cdot P(A|B) P(AB)=P(B)P(AB)


二、随机变量及其分布

2.0 随机变量

  • 离散型:取有限或可数个值
  • 连续型:在某区间内取无限多个值

2.0 分布函数(CDF)

F ( x ) = P ( X ≤ x ) F(x) = P(X \leq x) F(x)=P(Xx)

性质:右连续,单调不减, 0 ≤ F ( x ) ≤ 1 0 \le F(x) \le 1 0F(x)1


2.1 离散型随机变量

  • 分布律
    P ( X = x i ) = p i P(X = x_i) = p_i P(X=xi)=pi,满足 ∑ p i = 1 \sum p_i = 1 pi=1

  • 常见分布

    • 二项分布 B ( n , p ) B(n, p) B(n,p)
      描述 n n n 次独立重复试验的成功次数:
      P ( X = k ) = C n k p k ( 1 − p ) n − k P(X = k) = C_n^k p^k (1-p)^{n-k} P(X=k)=Cnkpk(1p)nk
      应用场景:产品质检中的合格品数量预测。

    • 泊松分布 P ( λ ) P(\lambda) P(λ)
      描述单位时间内事件发生的次数:
      P ( X = k ) = λ k e − λ k ! P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!} P(X=k)=k!λkeλ
      应用场景:客服中心每小时接到的电话数。

  • 离散型分布🌟🌟

分布参数概率质量函数 P ( X = x ) P(X=x) P(X=x)期望 E ( X ) E(X) E(X)方差 D ( X ) D(X) D(X)
0-1分布 p p p P ( 1 ) = p ,   P ( 0 ) = 1 − p P(1)=p,\ P(0)=1-p P(1)=p, P(0)=1p p p p p ( 1 − p ) p(1-p) p(1p)
二项分布 n , p n,p n,p P ( k ) = ( n k ) p k ( 1 − p ) n − k P(k)=\binom{n}{k}p^k(1-p)^{n-k} P(k)=(kn)pk(1p)nk n p np np n p ( 1 − p ) np(1-p) np(1p)
几何分布 p p p P ( k ) = ( 1 − p ) k − 1 p P(k)=(1-p)^{k-1}p P(k)=(1p)k1p 1 p \frac{1}{p} p1 1 − p p 2 \frac{1-p}{p^2} p21p
泊松分布 λ \lambda λ P ( k ) = λ k e − λ k ! P(k)=\frac{\lambda^k e^{-\lambda}}{k!} P(k)=k!λkeλ λ \lambda λ λ \lambda λ

2.2 连续型随机变量

  • 概率密度函数(PDF)
    f ( x ) ≥ 0 f(x) \geq 0 f(x)0,且 ∫ − ∞ + ∞ f ( x ) d x = 1 \int_{-\infty}^{+\infty} f(x)dx = 1 +f(x)dx=1

  • 常见分布 🌟🌟

    • 正态分布 N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2)
      f ( x ) = 1 σ 2 π e − ( x − μ ) 2 2 σ 2 f(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}} f(x)=σ2π 1e2σ2(xμ)2
      应用场景:学生考试成绩分布。

    • 指数分布 E x p ( λ ) Exp(\lambda) Exp(λ)
      f ( x ) = λ e − λ x ( x ≥ 0 ) f(x) = \lambda e^{-\lambda x} \quad (x \geq 0) f(x)=λeλx(x0)
      应用场景:电子元件的寿命建模。

  • 连续型分布

分布参数密度函数 f ( x ) f(x) f(x)期望 E ( X ) E(X) E(X)方差 D ( X ) D(X) D(X)
均匀分布 a , b a,b a,b f ( x ) = 1 b − a f(x)=\frac{1}{b-a} f(x)=ba1, x ∈ [ a , b ] x\in[a,b] x[a,b] a + b 2 \frac{a+b}{2} 2a+b ( b − a ) 2 12 \frac{(b-a)^2}{12} 12(ba)2
指数分布 λ \lambda λ f ( x ) = λ e − λ x f(x)=\lambda e^{-\lambda x} f(x)=λeλx, x ≥ 0 x\ge0 x0 1 λ \frac{1}{\lambda} λ1 1 λ 2 \frac{1}{\lambda^2} λ21
正态分布 μ , σ 2 \mu,\sigma^2 μ,σ2 f ( x ) = 1 2 π σ 2 e − ( x − μ ) 2 2 σ 2 f(x)=\frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{(x-\mu)^2}{2\sigma^2}} f(x)=2πσ2 1e2σ2(xμ)2 μ \mu μ σ 2 \sigma^2 σ2

2.3 多维随机变量

2.3.1 联合分布
  • 联合分布函数: F ( x , y ) = P ( X ≤ x , Y ≤ y ) F(x, y) = P(X \le x, Y \le y) F(x,y)=P(Xx,Yy)
  • 联合密度函数: f ( x , y ) f(x, y) f(x,y)(连续)或 P ( X = x , Y = y ) P(X=x, Y=y) P(X=x,Y=y)(离散)
2.3.2 边缘分布

f X ( x ) = ∫ − ∞ ∞ f ( x , y ) d y , f Y ( y ) = ∫ − ∞ ∞ f ( x , y ) d x f_X(x) = \int_{-\infty}^{\infty} f(x, y)dy,\quad f_Y(y) = \int_{-\infty}^{\infty} f(x, y)dx fX(x)=f(x,y)dy,fY(y)=f(x,y)dx

2.3.3 条件分布
  • 条件密度: f Y ∣ X ( y ∣ x ) = f ( x , y ) f X ( x ) f_{Y|X}(y|x) = \frac{f(x,y)}{f_X(x)} fYX(yx)=fX(x)f(x,y)
2.3.4 独立性判断

f ( x , y ) = f X ( x ) ⋅ f Y ( y ) f(x,y) = f_X(x) \cdot f_Y(y) f(x,y)=fX(x)fY(y),则 X X X Y Y Y 独立。


三、数字特征

3.1 期望(均值)🌟🌟🌟🌟

  • 定义
    离散型: E ( X ) = ∑ x i P ( X = x i ) E(X) = \sum x_i P(X=x_i) E(X)=xiP(X=xi)
    连续型: E ( X ) = ∫ − ∞ + ∞ x f ( x ) d x E(X) = \int_{-\infty}^{+\infty} x f(x)dx E(X)=+xf(x)dx

  • 线性性质 🌟🌟
    E ( a X + b ) = a E ( X ) + b E(aX + b) = aE(X) + b E(aX+b)=aE(X)+b

3.2 方差与标准差

  • 方差 🌟🌟🌟🌟🌟🌟
    D ( X ) = E [ ( X − E ( X ) ) 2 ] = E ( X 2 ) − [ E ( X ) ] 2 D(X) = E[(X - E(X))^2] = E(X^2) - [E(X)]^2 D(X)=E[(XE(X))2]=E(X2)[E(X)]2

  • 标准差
    σ X = D ( X ) \sigma_X = \sqrt{D(X)} σX=D(X)

  • 性质
    D ( a X + b ) = a 2 D ( X ) D(aX + b) = a^2D(X) D(aX+b)=a2D(X)

3.3 协方差与相关系数

  • 协方差:
    C o v ( X , Y ) = E [ ( X − E ( X ) ) ( Y − E ( Y ) ) ] \mathrm{Cov}(X,Y) = E[(X - E(X))(Y - E(Y))] Cov(X,Y)=E[(XE(X))(YE(Y))]
  • 相关系数:
    ρ X Y = C o v ( X , Y ) D ( X ) ⋅ D ( Y ) \rho_{XY} = \frac{\mathrm{Cov}(X,Y)}{\sqrt{D(X)} \cdot \sqrt{D(Y)}} ρXY=D(X) D(Y) Cov(X,Y)

四、大数定律与中心极限定理

4.1 大数定律

  • 弱大数定律
    样本均值依概率收敛于期望:
    1 n ∑ i = 1 n X i → P μ ( n → ∞ ) \frac{1}{n}\sum_{i=1}^n X_i \xrightarrow{P} \mu \quad (n \to \infty) n1i=1nXiP μ(n)

4.1 大数定律(辛钦)

X 1 , . . . , X n X_1, ..., X_n X1,...,Xn 独立同分布, E ( X i ) = μ E(X_i)=\mu E(Xi)=μ,则:
X ‾ n = 1 n ∑ i = 1 n X i → P μ \overline{X}_n = \frac{1}{n} \sum_{i=1}^n X_i \xrightarrow{P} \mu Xn=n1i=1nXiP μ

4.2 中心极限定理(CLT)

  • 核心结论
    独立同分布随机变量的和近似正态分布,设 X i X_i Xi 独立同分布, E ( X i ) = μ , D ( X i ) = σ 2 E(X_i)=\mu, D(X_i)=\sigma^2 E(Xi)=μ,D(Xi)=σ2,则:
    ∑ i = 1 n X i − n μ σ n → d N ( 0 , 1 ) \frac{\sum_{i=1}^n X_i - n\mu}{\sigma\sqrt{n}} \xrightarrow{d} N(0, 1) σn i=1nXinμd N(0,1)
    应用场景:民意调查中样本均值的分布。

4.3 切比雪夫不等式

P ( ∣ X − μ ∣ ≥ ε ) ≤ D ( X ) ε 2 P(|X - \mu| \ge \varepsilon) \le \frac{D(X)}{\varepsilon^2} P(Xμε)ε2D(X)


五、数理统计基础

5.1 抽样分布

  • 样本均值
    X ˉ = 1 n ∑ i = 1 n X i \bar{X} = \frac{1}{n}\sum_{i=1}^n X_i Xˉ=n1i=1nXi

  • 样本方差
    S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ˉ ) 2 S^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \bar{X})^2 S2=n11i=1n(XiXˉ)2

  • 样本统计量

  • 样本均值: X ‾ = 1 n ∑ X i \overline{X} = \frac{1}{n} \sum X_i X=n1Xi

  • 样本方差: S 2 = 1 n − 1 ∑ ( X i − X ‾ ) 2 S^2 = \frac{1}{n-1} \sum (X_i - \overline{X})^2 S2=n11(XiX)2

  • 三大分布

    • 卡方分布 χ 2 ( n ) \chi^2(n) χ2(n):若 X i ∼ N ( 0 , 1 ) X_i \sim N(0,1) XiN(0,1),则 ∑ i = 1 n X i 2 ∼ χ 2 ( n ) \sum_{i=1}^n X_i^2 \sim \chi^2(n) i=1nXi2χ2(n)
    • t分布 t ( n ) t(n) t(n) T = X ˉ − μ S / n ∼ t ( n − 1 ) T = \frac{\bar{X} - \mu}{S/\sqrt{n}} \sim t(n-1) T=S/n Xˉμt(n1)
    • F分布 F ( m , n ) F(m,n) F(m,n) F = S 1 2 / σ 1 2 S 2 2 / σ 2 2 ∼ F ( m − 1 , n − 1 ) F = \frac{S_1^2 / \sigma_1^2}{S_2^2 / \sigma_2^2} \sim F(m-1, n-1) F=S22/σ22S12/σ12F(m1,n1)

5.2 参数估计

  • 点估计:直接用样本统计量估计总体参数

  • 区间估计:构造置信区间估计参数

  • 最大似然估计(MLE)
    通过最大化似然函数 L ( θ ) = ∏ f ( x i ; θ ) L(\theta) = \prod f(x_i; \theta) L(θ)=f(xi;θ) 求解参数。

  • 正态总体均值的置信区间

    • σ \sigma σ已知: X ˉ ± z α / 2 σ n \bar{X} \pm z_{\alpha/2} \frac{\sigma}{\sqrt{n}} Xˉ±zα/2n σ
    • σ \sigma σ未知: X ˉ ± t α / 2 ( n − 1 ) S n \bar{X} \pm t_{\alpha/2}(n-1) \frac{S}{\sqrt{n}} Xˉ±tα/2(n1)n S
  • 点估计

    • 矩估计法:用样本矩估计总体矩。
    • 最大似然估计(MLE):最大化似然函数 L ( θ ) = ∏ f ( x i ; θ ) L(\theta) = \prod f(x_i; \theta) L(θ)=f(xi;θ)
  • 区间估计

    • 正态总体均值置信区间( σ \sigma σ已知):
      X ˉ ± z α / 2 σ n \bar{X} \pm z_{\alpha/2} \frac{\sigma}{\sqrt{n}} Xˉ±zα/2n σ
    • σ \sigma σ未知时:
      X ˉ ± t α / 2 ( n − 1 ) S n \bar{X} \pm t_{\alpha/2}(n-1) \frac{S}{\sqrt{n}} Xˉ±tα/2(n1)n S

六、假设检验

6.1 检验步骤

  1. 提出原假设 H 0 H_0 H0 和备择假设 H 1 H_1 H1
  2. 选择检验统计量(如Z统计量、t统计量)。
  3. 确定显著性水平 α \alpha α (如 0.05)和拒绝域。
  4. 求出 P 值或临界值并判断是否拒绝 H 0 H_0 H0,计算p值并得出结论。

6.2 常见检验方法

  • Z检验:已知总体方差时使用。
  • t检验:小样本且总体方差未知时使用。
  • 卡方检验:检验方差或分布拟合优度。
检验类型条件分布
单样本Z检验 σ \sigma σ已知 Z ∼ N ( 0 , 1 ) Z \sim N(0,1) ZN(0,1)
单样本t检验 σ \sigma σ未知 t ∼ t ( n − 1 ) t \sim t(n-1) tt(n1)
双样本t检验两正态总体 t ∼ t ( n 1 + n 2 − 2 ) t \sim t(n_1+n_2-2) tt(n1+n22)
卡方检验适配性、独立性检验 χ 2 \chi^2 χ2 分布

七、回归分析

7.1 一元线性回归

  • 模型
    Y = β 0 + β 1 X + ϵ Y = \beta_0 + \beta_1 X + \epsilon Y=β0+β1X+ϵ

  • 最小二乘法估计
    β ^ 1 = ∑ ( x i − x ˉ ) ( y i − y ˉ ) ∑ ( x i − x ˉ ) 2 , β ^ 0 = y ˉ − β ^ 1 x ˉ \hat{\beta}_1 = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sum (x_i - \bar{x})^2}, \quad \hat{\beta}_0 = \bar{y} - \hat{\beta}_1 \bar{x} β^1=(xixˉ)2(xixˉ)(yiyˉ),β^0=yˉβ^1xˉ

  • Python代码示例

    import numpy as np
    from sklearn.linear_model import LinearRegression
    
    X = np.array([1, 2, 3, 4, 5]).reshape(-1, 1)
    y = np.array([2, 4, 5, 4, 5])
    model = LinearRegression().fit(X, y)
    print(f"斜率: {model.coef_[0]:.2f}, 截距: {model.intercept_:.2f}")
    

八、其他常用公式

1. 协方差矩阵

Σ = [ D ( X ) C o v ( X , Y ) C o v ( Y , X ) D ( Y ) ] \Sigma = \begin{bmatrix} D(X) & \mathrm{Cov}(X,Y) \\ \mathrm{Cov}(Y,X) & D(Y) \end{bmatrix} Σ=[D(X)Cov(Y,X)Cov(X,Y)D(Y)]

2. 标准化公式(Z分数)

Z = X − μ σ ⇒ Z ∼ N ( 0 , 1 ) Z = \frac{X - \mu}{\sigma} \Rightarrow Z \sim N(0,1) Z=σXμZN(0,1)


九、实际应用案例

案例1:正态分布在数据分析中的应用

  • 场景:某班级学生身高服从正态分布 ( N(170, 5^2) ),计算身高超过180cm的概率。
    Python实现
    from scipy.stats import norm
    prob = 1 - norm.cdf(180, loc=170, scale=5)
    print(f"概率: {prob:.4f}")  # 输出:0.0228
    

案例2:假设检验在A/B测试中的应用

  • 场景:对比新旧页面转化率,使用Z检验判断差异是否显著。

相关文章:

  • C++进阶——异常
  • 计算机组成原理-系统总线
  • Hibernate(JPA) 和 MyBatis 的对比
  • Java基础关键_036_Stream
  • 使用Python实现矢量路径的压缩、解压与可视化
  • Python | 在Pandas中按照中值对箱形图排序
  • 二叉树的最近公共祖先二叉搜索树的最近公共祖先
  • 25届双非控制硕士求职回顾
  • ARM架构FFmpeg极致优化交叉编译指南
  • Linux:DNS服务配置(课堂实验总结)
  • 怎么免费下载GLTF/GLB格式模型文件,还可以在线编辑修改
  • instructor 库实现缓存
  • 【C#】.NET 8适配器模式实战:用C#实现高可用系统集成与接口桥接艺术
  • AutoGen参数说明
  • Kubernetes中的Label和Selector核心作用与应用场景
  • AI相关视频
  • 字符串与栈和队列-算法小结
  • 驱动开发硬核特训 · Day 10 (理论上篇):设备模型 ≈ 运行时的适配器机制
  • c++中的this
  • 用java代码如何存取数据库的blob字段
  • 贞丰古城:新垣旧梦间的商脉与烟火
  • 秦洪看盘|风格有所转变,热钱回流高弹性品种
  • 《制止滥用行政权力排除、限制竞争行为规定(修订草案征求意见稿)》公开征求意见
  • 《上海市建筑信息模型技术应用指南(2025版)》发布
  • 回望星河深处,唤醒文物记忆——读《发现武王墩》
  • 中央宣传部、全国妇联联合发布2025年“最美家庭”