当前位置：首页 > news >正文

概率论基础教程第5章连续型随机变量(二)

news 2025/8/20 8:42:43

5.3 均匀随机变量

定义与性质

均匀随机变量是最简单的连续型随机变量，其概率密度函数在整个定义区间内为常数。

(0,1)区间

如果随机变量 $X$ 的密度函数为：
$\begin{cases} 1 & 0 < x < 1 \\ 0 & \text{其他} \end{cases} \tag{3.1}$

则称 $X$ 在 $(0, 1)$ 区间上均匀分布。

验证：

$\geq 0$ 对所有 $x$ 成立
$dx=1\int_{-\infty}^{\infty} f(x) \, \mathrm{d}x = \int_{0}^{1} 1 \, \mathrm{d}x = 1$

一般区间

更一般地，如果随机变量 $X$ 的密度函数为：
$\begin{cases} \frac{1}{\beta - \alpha} & \alpha < x < \beta \\ 0 & \text{其他} \end{cases} \tag{3.2}$

则称 $X$ 在区间 $(α,β)(\alpha, \beta)$ 上均匀分布。

直观理解：

由于 $f (x)$ 在 $(α,β)(\alpha, \beta)$ 内为常数， $X$ 在区间内任何位置取值的概率密度相同
对任意 $a, b$ 满足 $α≤a<b≤β\alpha \leq a < b \leq \beta$ ：
$P\{a \leqslant X \leqslant b\} = \int_a^b f(x) \, \mathrm{d}x = \frac{b-a}{\beta-\alpha}$
这表明 $X$ 属于 $(α,β)(\alpha, \beta)$ 的任一子区间的概率等于该子区间长度与总区间长度的比值

分布函数

区间 $(α,β)(\alpha, \beta)$ 上均匀随机变量的分布函数为：
$\begin{cases} 0 & a \leq \alpha \\ \frac{a-\alpha}{\beta-\alpha} & \alpha < a < \beta \\ 1 & a \geq \beta \end{cases}$

期望

$\begin{aligned} E[X] &= \int_{-\infty}^{\infty} x f(x) \, \mathrm{d}x \\ &= \int_{\alpha}^{\beta} \frac{x}{\beta - \alpha} \, \mathrm{d}x \\ &= \frac{1}{\beta - \alpha} \left[ \frac{x^2}{2} \right]_{\alpha}^{\beta} \\ &= \frac{\beta^2 - \alpha^2}{2(\beta - \alpha)} \\ &= \frac{(\beta - \alpha)(\beta + \alpha)}{2(\beta - \alpha)} \\ &= \frac{\beta + \alpha}{2} \end{aligned}$

方差

首先计算 $E[X^2]$ ：
$\begin{aligned} E[X^2] &= \int_{\alpha}^{\beta} \frac{x^2}{\beta - \alpha} \, \mathrm{d}x \\ &= \frac{1}{\beta - \alpha} \left[ \frac{x^3}{3} \right]_{\alpha}^{\beta} \\ &= \frac{\beta^3 - \alpha^3}{3(\beta - \alpha)} \\ &= \frac{(\beta - \alpha)(\beta^2 + \alpha\beta + \alpha^2)}{3(\beta - \alpha)} \\ &= \frac{\beta^2 + \alpha\beta + \alpha^2}{3} \end{aligned}$

然后计算方差：
$\begin{aligned} Var(X) &= E[X^2] - (E[X])^2 \\ &= \frac{\beta^2 + \alpha\beta + \alpha^2}{3} - \left(\frac{\beta + \alpha}{2}\right)^2 \\ &= \frac{4(\beta^2 + \alpha\beta + \alpha^2) - 3(\beta^2 + 2\alpha\beta + \alpha^2)}{12} \\ &= \frac{4\beta^2 + 4\alpha\beta + 4\alpha^2 - 3\beta^2 - 6\alpha\beta - 3\alpha^2}{12} \\ &= \frac{\beta^2 - 2\alpha\beta + \alpha^2}{12} \\ &= \frac{(\beta - \alpha)^2}{12} \end{aligned}$

例题

例 3b：如果 $X$ 服从 $(0, 10)$ 上的均匀分布，计算：

(a) $P\{X < 3\}$ ：
$P\{X < 3\} = \int_{0}^{3} \frac{1}{10} \, \mathrm{d}x = \frac{3}{10}$
(b) $P\{X > 6\}$ ：
$P\{X > 6\} = \int_{6}^{10} \frac{1}{10} \, \mathrm{d}x = \frac{4}{10}$
© $P\{3 < X < 8\}$ ：
$P\{3 < X < 8\} = \int_{3}^{8} \frac{1}{10} \, \mathrm{d}x = \frac{5}{10} = \frac{1}{2}$

例 3c：某乘客在 7:00 到 7:30 之间到达车站的时间服从均匀分布，求：

(a) 等车时间不超过 5 分钟的概率

假设公交车在 7:00, 7:15, 7:30 等时间点发车，等车时间不超过 5 分钟意味着乘客在 7:10-7:15 或 7:25-7:30 之间到达：
$\begin{aligned} P\{\text{等车时间} \leq 5\} &= P\{10 < X < 15\} + P\{25 < X < 30\} \\ &= \int_{10}^{15} \frac{1}{30} \, \mathrm{d}x + \int_{25}^{30} \frac{1}{30} \, \mathrm{d}x \\ &= \frac{5}{30} + \frac{5}{30} = \frac{1}{3} \end{aligned}$
(b) 等车时间超过 10 分钟的概率

等车时间超过 10 分钟意味着乘客在 7:00-7:05 或 7:15-7:20 之间到达：
$\begin{aligned} P\{\text{等车时间} > 10\} &= P\{0 < X < 5\} + P\{15 < X < 20\} \\ &= \int_{0}^{5} \frac{1}{30} \, \mathrm{d}x + \int_{15}^{20} \frac{1}{30} \, \mathrm{d}x \\ &= \frac{5}{30} + \frac{5}{30} = \frac{1}{3} \end{aligned}$

例 3d：贝特朗悖论

考虑随机地从圆中取一根弦，该弦的长度大于该圆内接正三角形的边长的概率是多大？

问题：这个概率取决于"随机"的定义方式。

方法一：按弦到圆心的距离

弦的位置由它到圆心的距离 $D$ 决定， $\in [0, r]$
当 $D < r /2$ 时，弦长 > 内接正三角形边长
假设 $D$ 在 $[0, r]$ 上均匀分布：
$P\left\{D < \frac{r}{2}\right\} = \frac{r/2}{r} = \frac{1}{2}$

方法二：按弦与切线的夹角

弦的位置由它与切线的夹角 $θ\theta$ 决定， $θ∈[0∘,180∘]\theta \in [0^\circ, 180^\circ]$
当 $θ∈[60∘,120∘]\theta \in [60^\circ, 120^\circ]$ 时，弦长 > 内接正三角形边长
假设 $θ\theta$ 在 $[0∘,180∘][0^\circ, 180^\circ]$ 上均匀分布：
$P\{60 < \theta < 120\} = \frac{120 - 60}{180} = \frac{1}{3}$

[!TIP]
贝特朗悖论说明：在概率论中，"随机"的定义必须明确。不同的随机机制可能导致不同的概率结果。

5.4 正态随机变量

定义

如果随机变量 $X$ 的密度函数为：
$\frac{1}{\sqrt{2\pi}\sigma} e^{-(x-\mu)^2/2\sigma^2} \qquad -\infty < x < \infty$

则称 $X$ 是服从参数为 $μ\mu$ 和 $σ2\sigma^2$ 的正态分布的随机变量，简称为正态随机变量。

特性：

密度函数是一条关于 $μ\mu$ 对称的钟形曲线
$μ\mu$ 是分布的均值（期望）
$σ2\sigma^2$ 是分布的方差
$σ\sigma$ 是标准差

密度函数

需要验证：
$\frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^{\infty} e^{-(x-\mu)^2/2\sigma^2} \, \mathrm{d}x = 1$

令 $(x-\mu)/\sigma$ ，则：
$\frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^{\infty} e^{-(x-\mu)^2/2\sigma^2} \, \mathrm{d}x = \frac{1}{\sqrt{2\pi}}\int_{-\infty}^{\infty} e^{-y^2/2} \, \mathrm{d}y$

计算：
$\begin{aligned} I &= \int_{-\infty}^{\infty} e^{-y^2/2} \, \mathrm{d}y \\ I^2 &= \int_{-\infty}^{\infty} e^{-y^2/2} \, \mathrm{d}y \int_{-\infty}^{\infty} e^{-x^2/2} \, \mathrm{d}x \\ &= \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} e^{-(x^2+y^2)/2} \, \mathrm{d}x \, \mathrm{d}y \end{aligned}$

[!IMPORTANT]

极坐标变换技巧复习

坐标变换公式
笛卡尔坐标极坐标关系
$x$ $rcos⁡θr\cos\theta$ $r\cos\theta$
$y$ $rsin⁡θr\sin\theta$ $r\sin\theta$
$x^2 + y^2$ $r^2$ $\sqrt{x^2 + y^2}$
- $θ\theta$ $θ=arctan⁡(y/x)\theta = \arctan(y/x)$ （需考虑象限）
面积元素变换（关键！）

在极坐标下，面积元素发生变化：
$\boxed{dx\,dy = r\,dr\,d\theta}$

几何解释：在极坐标中，一个小区域的面积近似为扇形，其面积 = 半径 × 弧长 = $\cdot (r d\theta) \cdot dr = r\,dr\,d\theta$

数学解释：通过雅可比行列式计算：
$\frac{\partial(x,y)}{\partial(r,\theta)} = \begin{vmatrix} \frac{\partial x}{\partial r} & \frac{\partial x}{\partial \theta} \\ \frac{\partial y}{\partial r} & \frac{\partial y}{\partial \theta} \end{vmatrix} = \begin{vmatrix} \cos\theta & -r\sin\theta \\ \sin\theta & r\cos\theta \end{vmatrix} = r(\cos^2\theta + \sin^2\theta) = r$
因此 $dθdx\,dy = |J|\,dr\,d\theta = r\,dr\,d\theta$

积分区域转换
笛卡尔区域极坐标区域
整个平面 $R2\mathbb{R}^2$ $\leq r < \infty$ , $\leq \theta < 2\pi$
上半平面 $\geq 0$ $\leq r < \infty$ , $\leq \theta \leq \pi$
第一象限 $\geq 0, y \geq 0$ $\leq r < \infty$ , $\leq \theta \leq \frac{\pi}{2}$
圆盘 $x2+y2≤a2x^2 + y^2 \leq a^2$ $\leq r \leq a$ , $\leq \theta < 2\pi$

笛卡尔坐标	极坐标	关系
$x$	$rcos⁡θr\cos\theta$	$r\cos\theta$
$y$	$rsin⁡θr\sin\theta$	$r\sin\theta$
$x^2 + y^2$	$r^2$	$\sqrt{x^2 + y^2}$
-	$θ\theta$	$θ=arctan⁡(y/x)\theta = \arctan(y/x)$ （需考虑象限）

笛卡尔区域	极坐标区域
整个平面 $R2\mathbb{R}^2$	$\leq r < \infty$ , $\leq \theta < 2\pi$
上半平面 $\geq 0$	$\leq r < \infty$ , $\leq \theta \leq \pi$
第一象限 $\geq 0, y \geq 0$	$\leq r < \infty$ , $\leq \theta \leq \frac{\pi}{2}$
圆盘 $x2+y2≤a2x^2 + y^2 \leq a^2$	$\leq r \leq a$ , $\leq \theta < 2\pi$

使用极坐标变换 $r\cos\theta$ ， $r\sin\theta$ ：
$\begin{aligned} I^2 &= \int_{0}^{\infty} \int_{0}^{2\pi} e^{-r^2/2} r \, \mathrm{d}\theta \, \mathrm{d}r \\ &= 2\pi \int_{0}^{\infty} r e^{-r^2/2} \, \mathrm{d}r \\ &= -2\pi e^{-r^2/2} \Big|_{0}^{\infty} \\ &= 2\pi \end{aligned}$

[!NOTE]

计算角度积分：
$\int_{0}^{2\pi} d\theta = \theta \Big|_{0}^{2\pi} = 2\pi - 0 = 2\pi$

所以：
$I^2 = 2\pi \int_{0}^{\infty} r e^{-r^2/2} \, dr$

现在需要计算：
$\int_{0}^{\infty} r e^{-r^2/2} \, dr$

这是一个典型的可以通过变量替换解决的积分。

令 $\frac{r^2}{2}$ ，则：

$\, dr$ （因为 $dudr=r\frac{du}{dr} = r$ ）
当 $r = 0$ 时， $u = 0$
当 $\to \infty$ 时， $\to \infty$

代入得：
$\int_{0}^{\infty} r e^{-r^2/2} \, dr = \int_{0}^{\infty} e^{-u} \, du$

这个积分很简单：
$\int_{0}^{\infty} e^{-u} \, du = -e^{-u} \Big|_{0}^{\infty} = -(e^{-\infty} - e^{0}) = -(0 - 1) = 1$

$I^2 = 2\pi \cdot 1 = 2\pi$

因此：
$\sqrt{2\pi}$

这意味着：
$\int_{-\infty}^{\infty} e^{-x^2/2} \, dx = \sqrt{2\pi}$

因此 $\sqrt{2\pi}$ ，证明了：
$\frac{1}{\sqrt{2\pi}}\int_{-\infty}^{\infty} e^{-y^2/2} \, \mathrm{d}y = 1$

性质

线性变换

如果 $\sim N(\mu, \sigma^2)$ ，则 $\sim N(a\mu + b, a^2\sigma^2)$ 。

证明：

令 $Y = a X + b$ ， $a > 0$ （ $a < 0$ 时证明类似）
$Y$ 的分布函数：
$F_Y(x) = P\{Y \leq x\} = P\{aX + b \leq x\} = P\left\{X \leq \frac{x-b}{a}\right\} = F_X\left(\frac{x-b}{a}\right)$
求导得密度函数：
$\begin{aligned} f_Y(x) &= \frac{1}{a} f_X\left(\frac{x-b}{a}\right) \\ &= \frac{1}{\sqrt{2\pi a\sigma}} \exp\left\{-\left(\frac{x-b}{a} - \mu\right)^2 / 2\sigma^2\right\} \\ &= \frac{1}{\sqrt{2\pi a\sigma}} \exp\left\{-\left(x - b - a\mu\right)^2 / 2(a\sigma)^2\right\} \end{aligned}$
这表明 $\sim N(a\mu + b, a^2\sigma^2)$

标准正态分布

如果 $\sim N(\mu, \sigma^2)$ ，则 $\mu)/\sigma \sim N(0, 1)$ 。

标准正态分布的密度函数为：
$f_Z(z) = \frac{1}{\sqrt{2\pi}} e^{-z^2/2}$
分布函数记为 $Φ(z)\Phi(z)$ ：
$\Phi(z) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{z} e^{-y^2/2} \, \mathrm{d}y$
对称性： $Φ(−z)=1−Φ(z)\Phi(-z) = 1 - \Phi(z)$

期望与方差

例 4a：设 $X$ 是参数为 $μ\mu$ 和 $σ2\sigma^2$ 的正态随机变量，求 $E [X]$ 和 $Va r (X)$ 。

先计算标准正态变量 $Z$ 的期望：
$\frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} z e^{-z^2/2} \, \mathrm{d}z = 0$
（奇函数在对称区间上的积分）
计算 $Var(Z) = E[Z^2]$ ：
$\begin{aligned} Var(Z) &= \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} z^2 e^{-z^2/2} \, \mathrm{d}z \\ &= \frac{1}{\sqrt{2\pi}} \left[ -z e^{-z^2/2} \Big|_{-\infty}^{\infty} + \int_{-\infty}^{\infty} e^{-z^2/2} \, \mathrm{d}z \right] \\ &= \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} e^{-z^2/2} \, \mathrm{d}z = 1 \end{aligned}$
由于 $\mu + \sigma Z$ ：
$\begin{aligned} E[X] &= \mu + \sigma E[Z] = \mu \\ Var(X) &= \sigma^2 Var(Z) = \sigma^2 \end{aligned}$

[!IMPORTANT]

标准正态分布方差的详细计算

步骤 1：设置积分
$\frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} z^2 e^{-z^2/2} \, dz$

步骤 2：应用分部积分法

我们需要计算 $dz\int_{-\infty}^{\infty} z^2 e^{-z^2/2} \, dz$ ，使用分部积分法：

回忆分部积分公式：
$\int u \, dv = uv - \int v \, du$

选择：

令 $u = z$ ，则 $d u = d z$
令 $dv = z e^{-z^2/2} \, dz$ ，则 $v = -e^{-z^2/2}$ （因为 $ddz(−e−z2/2)=ze−z2/2\frac{d}{dz}(-e^{-z^2/2}) = z e^{-z^2/2}$ ）

应用公式：
$\begin{aligned} \int z^2 e^{-z^2/2} \, dz &= \int u \, dv \\ &= uv - \int v \, du \\ &= z \cdot (-e^{-z^2/2}) - \int (-e^{-z^2/2}) \, dz \\ &= -z e^{-z^2/2} + \int e^{-z^2/2} \, dz \end{aligned}$

步骤 3：计算定积分

将上述结果应用于定积分：
$\int_{-\infty}^{\infty} z^2 e^{-z^2/2} \, dz = \left[ -z e^{-z^2/2} \right]_{-\infty}^{\infty} + \int_{-\infty}^{\infty} e^{-z^2/2} \, dz$

分析边界项 $[−ze−z2/2]−∞∞\left[ -z e^{-z^2/2} \right]_{-\infty}^{\infty}$ ：

当 $\to \infty$ 时：
$\lim_{z \to \infty} (-z e^{-z^2/2}) = \lim_{z \to \infty} \frac{-z}{e^{z^2/2}}$
这是一个 $∞∞\frac{\infty}{\infty}$ 型不定式，应用洛必达法则：
$\lim_{z \to \infty} \frac{-z}{e^{z^2/2}} = \lim_{z \to \infty} \frac{-1}{z e^{z^2/2}} = 0$
（分子是常数，分母趋向无穷大）

当 $\to -\infty$ 时：
$\lim_{z \to -\infty} (-z e^{-z^2/2}) = \lim_{z \to -\infty} \frac{-z}{e^{z^2/2}}$
令 $w = - z$ ，则 $\to \infty$ ：
$\lim_{w \to \infty} \frac{w}{e^{w^2/2}} = 0$
（同样应用洛必达法则）

因此：
$\left[ -z e^{-z^2/2} \right]_{-\infty}^{\infty} = 0 - 0 = 0$

步骤 4：简化表达式

代入边界项的结果：
$\int_{-\infty}^{\infty} z^2 e^{-z^2/2} \, dz = 0 + \int_{-\infty}^{\infty} e^{-z^2/2} \, dz = \int_{-\infty}^{\infty} e^{-z^2/2} \, dz$

步骤 5：应用高斯积分结果

从之前的讨论（极坐标变换）我们知道：
$\int_{-\infty}^{\infty} e^{-z^2/2} \, dz = \sqrt{2\pi}$

将结果代入方差公式：
$\begin{aligned} Var(Z) &= \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} z^2 e^{-z^2/2} \, dz \\ &= \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} e^{-z^2/2} \, dz \\ &= \frac{1}{\sqrt{2\pi}} \cdot \sqrt{2\pi} \\ &= 1 \end{aligned}$

例题

例 4b：如果 $X$ 服从正态分布，参数为 $μ=3\mu=3$ 和 $σ2=9\sigma^2 = 9$ （即 $σ=3\sigma = 3$ ），求：

(a) $P{2≤X≤5}P\{2 \leq X \leq 5\}$ ：
$\begin{aligned} P\{2 < X < 5\} &= P\left\{\frac{2-3}{3} < \frac{X-3}{3} < \frac{5-3}{3}\right\} \\ &= P\left\{-\frac{1}{3} < Z < \frac{2}{3}\right\} \\ &= \Phi\left(\frac{2}{3}\right) - \Phi\left(-\frac{1}{3}\right) \\ &= \Phi\left(\frac{2}{3}\right) - \left[1 - \Phi\left(\frac{1}{3}\right)\right] \\ &\approx 0.7486 - (1 - 0.6293) = 0.3779 \end{aligned}$
(b) $P\{X > 0\}$ ：
$\begin{aligned} P\{X > 0\} &= P\left\{\frac{X-3}{3} > \frac{0-3}{3}\right\} \\ &= P\{Z > -1\} \\ &= 1 - \Phi(-1) \\ &= \Phi(1) \approx 0.8413 \end{aligned}$
© $P\{|X-3| > 6\}$ ：
$\begin{aligned} P\{|X-3| > 6\} &= P\{X > 9\} + P\{X < -3\} \\ &= P\{Z > 2\} + P\{Z < -2\} \\ &= [1 - \Phi(2)] + \Phi(-2) \\ &= 2[1 - \Phi(2)] \approx 2(1 - 0.9772) = 0.0456 \end{aligned}$

例 4c：考试分数的等级划分

如果考试分数服从正态分布 $N(μ,σ2)N(\mu, \sigma^2)$ ，则：

A等（超过 $μ+σ\mu+\sigma$ ）： $P{X>μ+σ}=1−Φ(1)≈0.1587P\{X > \mu + \sigma\} = 1 - \Phi(1) \approx 0.1587$
B等（ $μ\mu$ 到 $μ+σ\mu+\sigma$ ）： $P{μ<X<μ+σ}=Φ(1)−Φ(0)≈0.3413P\{\mu < X < \mu + \sigma\} = \Phi(1) - \Phi(0) \approx 0.3413$
C等（ $μ−σ\mu-\sigma$ 到 $μ\mu$ ）： $P{μ−σ<X<μ}=Φ(0)−Φ(−1)≈0.3413P\{\mu - \sigma < X < \mu\} = \Phi(0) - \Phi(-1) \approx 0.3413$
D等（ $μ−2σ\mu-2\sigma$ 到 $μ−σ\mu-\sigma$ ）： $P{μ−2σ<X<μ−σ}=Φ(1)−Φ(2)≈0.1359P\{\mu - 2\sigma < X < \mu - \sigma\} = \Phi(1) - \Phi(2) \approx 0.1359$
E等（低于 $μ−2σ\mu-2\sigma$ ）： $P{X<μ−2σ}=Φ(−2)≈0.0228P\{X < \mu - 2\sigma\} = \Phi(-2) \approx 0.0228$

因此，近似地：

A等：16%
B等：34%
C等：34%
D等：14%
E等：2%

例 4d：怀孕期问题

母亲的怀孕期 $\sim N(270, 100)$ （即 $μ=270\mu = 270$ ， $σ=10\sigma = 10$ ）。

如果被告是孩子的父亲，母亲在被告出国前或回国后怀孕的概率：
$\begin{aligned} P\{X > 290 \text{ 或 } X < 240\} &= P\{X > 290\} + P\{X < 240\} \\ &= P\left\{\frac{X-270}{10} > 2\right\} + P\left\{\frac{X-270}{10} < -3\right\} \\ &= [1 - \Phi(2)] + \Phi(-3) \\ &\approx (1 - 0.9772) + 0.0013 = 0.0241 \end{aligned}$

例 4e：电信信号传输

当传送信息为 1 时发送值 2，为 0 时发送值 -2。接收值 $R = x + N$ ，其中 $\sim N(0,1)$ 。

信息 1 被错误认为 0 的概率（当 $R < 0.5$ ）：
$P\{2 + N < 0.5\} = P\{N < -1.5\} = 1 - \Phi(1.5) \approx 0.0668$
信息 0 被错误认为 1 的概率（当 $\geq 0.5$ ）：
$P\{-2 + N \geq 0.5\} = P\{N \geq 2.5\} = 1 - \Phi(2.5) \approx 0.0062$

正态近似

棣莫弗-拉普拉斯极限定理

在 $n$ 次独立重复试验中，设每次成功的概率为 $p$ ，记成功总次数为 $S_n$ ，则对任意 $a < b$ ：

$P\left\{a \leqslant \frac{S_n - np}{\sqrt{np(1-p)}} \leqslant b\right\} \to \Phi(b) - \Phi(a) \quad \text{当 } n \to \infty$

使用条件：

当 $\geq 10$ 时，正态近似效果很好
需要进行连续性修正（因为二项分布是离散的，而正态分布是连续的）

连续性修正：

$P{Sn=i}≈P{i−0.5<X<i+0.5}P\{S_n = i\} \approx P\{i-0.5 < X < i+0.5\}$ ，其中 $X$ 为正态变量

例 4g：抛 40 次均匀硬币

设 $X$ 为正面次数， $\sim \text{Binomial}(40, 0.5)$ 。

正态近似：
$\begin{aligned} P\{X = 20\} &= P\{19.5 < X < 20.5\} \\ &= P\left\{\frac{19.5 - 20}{\sqrt{10}} < \frac{X - 20}{\sqrt{10}} < \frac{20.5 - 20}{\sqrt{10}}\right\} \\ &\approx P\{-0.16 < Z < 0.16\} \\ &= \Phi(0.16) - \Phi(-0.16) \approx 0.1272 \end{aligned}$
精确解：
$P\{X = 20\} = \binom{40}{20} \left(\frac{1}{2}\right)^{40} \approx 0.1254$

例 4h：学院招生问题

设 $X$ 为入学新生人数， $\sim \text{Binomial}(450, 0.3)$ 。

正态近似：
$\begin{aligned} P\{X \geq 150\} &\approx P\{X \geq 150.5\} \\ &= P\left\{\frac{X - 450 \times 0.3}{\sqrt{450 \times 0.3 \times 0.7}} \geq \frac{150.5 - 135}{\sqrt{94.5}}\right\} \\ &= P\left\{Z \geq \frac{15.5}{9.72}\right\} \\ &= P\{Z \geq 1.59\} \\ &\approx 1 - \Phi(1.59) \approx 0.0559 \end{aligned}$

因此，入学新生超过 150 名的概率约为 5.59%。

例 4i：胆固醇试验

设 $X$ 为胆固醇降低的人数， $\sim \text{Binomial}(100, 0.5)$ （假设食品无效）。

正态近似：
$\begin{aligned} P\{X \geq 65\} &\approx P\{X \geq 64.5\} \\ &= P\left\{\frac{X - 50}{5} \geq \frac{64.5 - 50}{5}\right\} \\ &= P\{Z \geq 2.9\} \\ &\approx 1 - \Phi(2.9) \approx 0.0019 \end{aligned}$

因此，即使食品无效，营养学家仍承认它有效的概率约为 0.19%。

例 4j：纽约市民支持率

设 $S_n$ 为支持禁令的人数， $Sn∼Binomial(n,0.52)S_n \sim \text{Binomial}(n, 0.52)$ 。

正态近似：
$\begin{aligned} P\{S_n > 0.5n\} &= P\left\{\frac{S_n - 0.52n}{\sqrt{n \times 0.52 \times 0.48}} > \frac{0.5n - 0.52n}{\sqrt{n \times 0.52 \times 0.48}}\right\} \\ &= P\left\{Z > -0.04\sqrt{n}\right\} \\ &= \Phi(0.04\sqrt{n}) \end{aligned}$
计算：
- $n = 11$ ： $Φ(0.1328)≈0.5528\Phi(0.1328) \approx 0.5528$
- $n = 101$ ： $Φ(0.4020)≈0.6562\Phi(0.4020) \approx 0.6562$
- $n = 1001$ ： $Φ(1.2665)≈0.8973\Phi(1.2665) \approx 0.8973$
为使概率 > 0.95：
$\Phi(0.04\sqrt{n}) > 0.95 \Rightarrow 0.04\sqrt{n} > 1.645 \Rightarrow n \geq 1692$

本节小结

特性	公式
密度函数	$\begin{cases} \frac{1}{\beta-\alpha} & \alpha < x < \beta \\ 0 & \text{其他} \end{cases}$
分布函数	$\begin{cases} 0 & a \leq \alpha \\ \frac{a-\alpha}{\beta-\alpha} & \alpha < a < \beta \\ 1 & a \geq \beta \end{cases}$
期望	$\frac{\alpha + \beta}{2}$
方差	$\frac{(\beta - \alpha)^2}{12}$

正态随机变量

特性	公式
密度函数	$\frac{1}{\sqrt{2\pi}\sigma} e^{-(x-\mu)^2/2\sigma^2}$
标准正态分布	$\frac{X-\mu}{\sigma} \sim N(0,1)$
分布函数	$dy\Phi(z) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{z} e^{-y^2/2} \, \mathrm{d}y$
对称性	$Φ(−z)=1−Φ(z)\Phi(-z) = 1 - \Phi(z)$
期望	$\mu$
方差	$\sigma^2$
线性变换	$\sim N(a\mu + b, a^2\sigma^2)$

二项分布的正态近似

条件： $\geq 10$
连续性修正： $P{Sn=i}≈P{i−0.5<X<i+0.5}P\{S_n = i\} \approx P\{i-0.5 < X < i+0.5\}$
标准化： $Sn−npnp(1−p)≈N(0,1)\frac{S_n - np}{\sqrt{np(1-p)}} \approx N(0,1)$ 概率论基础教程第5章连续型随机变量(一)