当前位置：首页 > news >正文

定积分与不定积分在概率统计中的应用

news 2025/10/30 10:15:47

前言

本文隶属于专栏《机器学习数学通关指南》，该专栏为笔者原创，引用请注明来源，不足和错误之处请在评论区帮忙指出，谢谢！

本专栏目录结构和参考文献请见《机器学习数学通关指南》

ima 知识库

知识库广场搜索：

知识库	创建人
机器学习	@Shockang
机器学习数学基础	@Shockang
深度学习	@Shockang

正文

在这里插入图片描述

📝 引言

在机器学习的数学基础中，概率论占据核心位置。而连续型随机变量的统计特性计算，主要依赖于积分运算。本文将深入探讨定积分与不定积分在计算概率密度函数的期望值、方差等统计量中的关系与应用，为机器学习中的概率模型打下坚实基础。

🔍 一、关键概念解析

1.1 概率密度函数 (Probability Density Function, PDF)

连续型随机变量X的概率密度函数p(x)满足三个基本特性：

非负性：p(x) ≥ 0
归一性： $\int_{-\infty}^{+\infty} p(x)dx = 1$
区间概率： $\leq b) = \int_a^b p(x)dx$

区间概率的计算正是定积分的直接应用，表示概率密度曲线下方的面积。

1.2 数学期望 (Expectation)

连续型随机变量的期望定义为：

$\int_{-\infty}^{+\infty} x \cdot p(x)dx$

这里使用定积分计算加权平均值，其中权重为概率密度。期望代表了随机变量的"平均位置"或"中心趋势"。

1.3 方差 (Variance)

方差度量随机变量围绕期望值的分散程度：

$E[(X-\mu)^2] = \int_{-\infty}^{+\infty} (x-\mu)^2 p(x)dx$

其中μ=E[X]。方差也可以通过以下公式计算：

$E[X^2] - (E[X])^2 = \int_{-\infty}^{+\infty} x^2 p(x)dx - \mu^2$

这种计算方式往往更为便捷。

在这里插入图片描述

🔄 二、定积分与不定积分在统计量计算中的关系

2.1 作用区分

定积分：直接计算统计量的数值结果，如期望、方差等
不定积分：寻找原函数，为定积分计算提供工具

2.2 计算过程中的配合

在计算概率统计量时，我们通常需要：

使用不定积分找到原函数 $\int f(x)dx$
应用定积分公式 $\int_a^b f(x)dx = F(b) - F(a)$ 得到最终结果

在这里插入图片描述

📈 三、典型概率分布的统计量计算

3.1 均匀分布 U(a,b)

密度函数： $\frac{1}{b-a}, a \leq x \leq b$

期望计算：
$\int_a^b x \cdot \frac{1}{b-a}dx = \frac{1}{b-a} \cdot \left. \frac{x^2}{2} \right|_a^b = \frac{a+b}{2}$

方差计算：
$\int_a^b x^2 \cdot \frac{1}{b-a}dx - \left( \frac{a+b}{2} \right)^2 = \frac{(b-a)^2}{12}$

均匀分布的统计量计算展示了定积分的直接应用。

3.2 指数分布 Exp(λ)

密度函数： $\lambda e^{-\lambda x}, x \geq 0$

期望计算：
$\int_0^{\infty} x \cdot \lambda e^{-\lambda x}dx$

应用分部积分法：令 $\lambda e^{-\lambda x}dx$

得到： $\left. -xe^{-\lambda x} \right|_0^{\infty} + \int_0^{\infty} e^{-\lambda x}dx = 0 + \frac{1}{\lambda} = \frac{1}{\lambda}$

方差计算：
$E[X^2] - (E[X])^2 = \frac{2}{\lambda^2} - \frac{1}{\lambda^2} = \frac{1}{\lambda^2}$

指数分布的计算展示了处理无穷积分区间的技巧。

3.3 正态分布 N(μ,σ²)

密度函数： $\frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}$

期望计算：
$\int_{-\infty}^{\infty} x \cdot \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}dx$

通过变量替换 $\frac{x-\mu}{\sigma}$ ，可证明 $\mu$

方差计算：
利用特殊积分公式和变量替换，可证明 $\sigma^2$

正态分布的计算展示了变量替换和对称性在积分中的应用。

在这里插入图片描述

🔄 四、离散与连续随机变量的统计量计算比较

4.1 计算方式对比

概念	离散随机变量	连续随机变量	积分类型
概率度量	P(X=xᵢ)	p(x)dx	-
期望计算	∑ xᵢP(xᵢ)	∫ x·p(x)dx	定积分
方差计算	∑ (xᵢ-μ)²P(xᵢ)	∫ (x-μ)²p(x)dx	定积分
主要工具	求和	积分	定积分

离散随机变量使用求和计算统计量，而连续随机变量则需要积分。积分可以理解为连续情况下的"无穷细分求和"。

4.2 从离散到连续的过渡

当离散点无限增多、间距趋于零时，求和转变为积分：

$\lim_{n \to \infty} \sum_{i=1}^{n} f(x_i)\Delta x = \int_a^b f(x)dx$

这一过渡解释了为何连续随机变量的统计量计算需要使用积分。

在这里插入图片描述

🛠️ 五、积分技巧在概率统计计算中的应用

5.1 常用积分技巧

分部积分法： $\int u(x)v'(x)dx = u(x)v(x) - \int u'(x)v(x)dx$
- 适用：计算形如 $\int x^n e^{ax}dx$ 的积分
换元法：设 $u = g (x)$ ，则 $\int f(g(x))g'(x)dx = \int f(u)du$
- 适用：简化复杂表达式，如正态分布中 $\frac{x-\mu}{\sigma}$
对称性利用：
- 奇函数在对称区间的积分为零
- 偶函数在对称区间积分等于两倍的半区间积分
特殊函数应用：
- Gamma函数： $\Gamma(\alpha) = \int_0^{\infty} x^{\alpha-1}e^{-x}dx$
- 应用于计算多种分布的矩

这些技巧极大简化了统计量的计算过程。

5.2 常见积分公式在概率论中的应用

高斯积分： $\int_{-\infty}^{\infty} e^{-x^2}dx = \sqrt{\pi}$
- 用于正态分布的归一化常数计算
随机变量函数的期望： $\int_{-\infty}^{\infty} g(x)p(x)dx$
- 用于计算高阶矩、变换后的随机变量统计特性
条件期望的计算：通过联合密度和边缘密度的积分比值确定

在这里插入图片描述

🔬 六、机器学习中的实际应用

6.1 最大似然估计中的积分

在最大似然估计中，对数似然函数的极值点往往需要计算积分。例如，正态分布参数估计时：

$\frac{\partial}{\partial \mu} \sum_{i=1}^n \ln\left(\frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x_i-\mu)^2}{2\sigma^2}}\right) = 0$

这一过程中，定积分和不定积分的概念与技巧直接应用于参数估计。

6.2 贝叶斯推断与积分

贝叶斯统计中，后验分布的计算需要：

$p(\theta|x) = \frac{p(x|\theta)p(\theta)}{\int p(x|\theta)p(\theta)d\theta}$

分母中的积分（边缘似然）计算是贝叶斯方法的核心，通常需要数值积分方法如MCMC。

6.3 信息熵与KL散度

信息熵定义： $-\int p(x)\ln p(x)dx$

KL散度： $D_{KL}(p||q) = \int p(x)\ln\frac{p(x)}{q(x)}dx$

这些信息论指标在深度学习中常用作损失函数，其计算依赖于定积分概念。

在这里插入图片描述

🧩 七、从理论到实践：Python实现

7.1 使用SciPy计算统计量

import numpy as np
from scipy import stats
import matplotlib.pyplot as plt

# 均匀分布
a, b = 0, 1  # 分布参数
uniform_dist = stats.uniform(loc=a, scale=b-a)

# 理论值
theoretical_mean = (a + b) / 2
theoretical_var = (b - a)**2 / 12

# 数值积分验证
x = np.linspace(a, b, 1000)
pdf = uniform_dist.pdf(x)
dx = x - x[0]
numerical_mean = np.sum(x * pdf * dx)
numerical_var = np.sum((x - numerical_mean)**2 * pdf * dx)

print(f"均匀分布 U({a},{b}):")
print(f"理论期望: {theoretical_mean}, 数值计算: {numerical_mean}")
print(f"理论方差: {theoretical_var}, 数值计算: {numerical_var}")

这段代码展示了如何使用数值方法验证理论结果。

7.2 蒙特卡洛方法估计统计量

对于难以直接积分的复杂分布，可使用蒙特卡洛方法：

import numpy as np

# 假设有复杂分布的随机样本
def complex_pdf_samples(n_samples=10000):
    # 这里可以是任何复杂分布的采样方法
    return np.random.gamma(shape=2, scale=3, size=n_samples)

samples = complex_pdf_samples()
monte_carlo_mean = np.mean(samples)
monte_carlo_var = np.var(samples)

# 理论值（伽马分布）
theoretical_mean = 2 * 3  # shape * scale
theoretical_var = 2 * 3**2  # shape * scale^2

print(f"蒙特卡洛估计结果:")
print(f"样本期望: {monte_carlo_mean}, 理论期望: {theoretical_mean}")
print(f"样本方差: {monte_carlo_var}, 理论方差: {theoretical_var}")