概率论基础教程第5章 连续型随机变量(二)
5.3 均匀随机变量
定义与性质
均匀随机变量是最简单的连续型随机变量,其概率密度函数在整个定义区间内为常数。
(0,1)区间
如果随机变量 XXX 的密度函数为:
f(x)={10<x<10其他(3.1)
f(x) = \begin{cases}
1 & 0 < x < 1 \\
0 & \text{其他}
\end{cases}
\tag{3.1}
f(x)={100<x<1其他(3.1)
则称 XXX 在 (0,1)(0,1)(0,1) 区间上均匀分布。
验证:
- f(x)≥0f(x) \geq 0f(x)≥0 对所有 xxx 成立
- ∫−∞∞f(x) dx=∫011 dx=1\int_{-\infty}^{\infty} f(x) \, \mathrm{d}x = \int_{0}^{1} 1 \, \mathrm{d}x = 1∫−∞∞f(x)dx=∫011dx=1
一般区间
更一般地,如果随机变量 XXX 的密度函数为:
f(x)={1β−αα<x<β0其他(3.2)
f(x) = \begin{cases}
\frac{1}{\beta - \alpha} & \alpha < x < \beta \\
0 & \text{其他}
\end{cases}
\tag{3.2}
f(x)={β−α10α<x<β其他(3.2)
则称 XXX 在区间 (α,β)(\alpha, \beta)(α,β) 上均匀分布。
直观理解:
-
由于 f(x)f(x)f(x) 在 (α,β)(\alpha, \beta)(α,β) 内为常数,XXX 在区间内任何位置取值的概率密度相同
-
对任意 a,ba, ba,b 满足 α≤a<b≤β\alpha \leq a < b \leq \betaα≤a<b≤β:
P{a⩽X⩽b}=∫abf(x) dx=b−aβ−α P\{a \leqslant X \leqslant b\} = \int_a^b f(x) \, \mathrm{d}x = \frac{b-a}{\beta-\alpha} P{a⩽X⩽b}=∫abf(x)dx=β−αb−a -
这表明 XXX 属于 (α,β)(\alpha, \beta)(α,β) 的任一子区间的概率等于该子区间长度与总区间长度的比值
分布函数
区间 (α,β)(\alpha, \beta)(α,β) 上均匀随机变量的分布函数为:
F(a)={0a≤αa−αβ−αα<a<β1a≥β
F(a) = \begin{cases}
0 & a \leq \alpha \\
\frac{a-\alpha}{\beta-\alpha} & \alpha < a < \beta \\
1 & a \geq \beta
\end{cases}
F(a)=⎩⎨⎧0β−αa−α1a≤αα<a<βa≥β
期望
E[X]=∫−∞∞xf(x) dx=∫αβxβ−α dx=1β−α[x22]αβ=β2−α22(β−α)=(β−α)(β+α)2(β−α)=β+α2 \begin{aligned} E[X] &= \int_{-\infty}^{\infty} x f(x) \, \mathrm{d}x \\ &= \int_{\alpha}^{\beta} \frac{x}{\beta - \alpha} \, \mathrm{d}x \\ &= \frac{1}{\beta - \alpha} \left[ \frac{x^2}{2} \right]_{\alpha}^{\beta} \\ &= \frac{\beta^2 - \alpha^2}{2(\beta - \alpha)} \\ &= \frac{(\beta - \alpha)(\beta + \alpha)}{2(\beta - \alpha)} \\ &= \frac{\beta + \alpha}{2} \end{aligned} E[X]=∫−∞∞xf(x)dx=∫αββ−αxdx=β−α1[2x2]αβ=2(β−α)β2−α2=2(β−α)(β−α)(β+α)=2β+α
方差
首先计算 E[X2]E[X^2]E[X2]:
E[X2]=∫αβx2β−α dx=1β−α[x33]αβ=β3−α33(β−α)=(β−α)(β2+αβ+α2)3(β−α)=β2+αβ+α23
\begin{aligned}
E[X^2] &= \int_{\alpha}^{\beta} \frac{x^2}{\beta - \alpha} \, \mathrm{d}x \\
&= \frac{1}{\beta - \alpha} \left[ \frac{x^3}{3} \right]_{\alpha}^{\beta} \\
&= \frac{\beta^3 - \alpha^3}{3(\beta - \alpha)} \\
&= \frac{(\beta - \alpha)(\beta^2 + \alpha\beta + \alpha^2)}{3(\beta - \alpha)} \\
&= \frac{\beta^2 + \alpha\beta + \alpha^2}{3}
\end{aligned}
E[X2]=∫αββ−αx2dx=β−α1[3x3]αβ=3(β−α)β3−α3=3(β−α)(β−α)(β2+αβ+α2)=3β2+αβ+α2
然后计算方差:
Var(X)=E[X2]−(E[X])2=β2+αβ+α23−(β+α2)2=4(β2+αβ+α2)−3(β2+2αβ+α2)12=4β2+4αβ+4α2−3β2−6αβ−3α212=β2−2αβ+α212=(β−α)212
\begin{aligned}
Var(X) &= E[X^2] - (E[X])^2 \\
&= \frac{\beta^2 + \alpha\beta + \alpha^2}{3} - \left(\frac{\beta + \alpha}{2}\right)^2 \\
&= \frac{4(\beta^2 + \alpha\beta + \alpha^2) - 3(\beta^2 + 2\alpha\beta + \alpha^2)}{12} \\
&= \frac{4\beta^2 + 4\alpha\beta + 4\alpha^2 - 3\beta^2 - 6\alpha\beta - 3\alpha^2}{12} \\
&= \frac{\beta^2 - 2\alpha\beta + \alpha^2}{12} \\
&= \frac{(\beta - \alpha)^2}{12}
\end{aligned}
Var(X)=E[X2]−(E[X])2=3β2+αβ+α2−(2β+α)2=124(β2+αβ+α2)−3(β2+2αβ+α2)=124β2+4αβ+4α2−3β2−6αβ−3α2=12β2−2αβ+α2=12(β−α)2
例题
例 3b:如果 XXX 服从 (0,10)(0, 10)(0,10) 上的均匀分布,计算:
-
(a) P{X<3}P\{X < 3\}P{X<3}:
P{X<3}=∫03110 dx=310 P\{X < 3\} = \int_{0}^{3} \frac{1}{10} \, \mathrm{d}x = \frac{3}{10} P{X<3}=∫03101dx=103 -
(b) P{X>6}P\{X > 6\}P{X>6}:
P{X>6}=∫610110 dx=410 P\{X > 6\} = \int_{6}^{10} \frac{1}{10} \, \mathrm{d}x = \frac{4}{10} P{X>6}=∫610101dx=104 -
© P{3<X<8}P\{3 < X < 8\}P{3<X<8}:
P{3<X<8}=∫38110 dx=510=12 P\{3 < X < 8\} = \int_{3}^{8} \frac{1}{10} \, \mathrm{d}x = \frac{5}{10} = \frac{1}{2} P{3<X<8}=∫38101dx=105=21
例 3c:某乘客在 7:00 到 7:30 之间到达车站的时间服从均匀分布,求:
-
(a) 等车时间不超过 5 分钟的概率
假设公交车在 7:00, 7:15, 7:30 等时间点发车,等车时间不超过 5 分钟意味着乘客在 7:10-7:15 或 7:25-7:30 之间到达:
P{等车时间≤5}=P{10<X<15}+P{25<X<30}=∫1015130 dx+∫2530130 dx=530+530=13 \begin{aligned} P\{\text{等车时间} \leq 5\} &= P\{10 < X < 15\} + P\{25 < X < 30\} \\ &= \int_{10}^{15} \frac{1}{30} \, \mathrm{d}x + \int_{25}^{30} \frac{1}{30} \, \mathrm{d}x \\ &= \frac{5}{30} + \frac{5}{30} = \frac{1}{3} \end{aligned} P{等车时间≤5}=P{10<X<15}+P{25<X<30}=∫1015301dx+∫2530301dx=305+305=31 -
(b) 等车时间超过 10 分钟的概率
等车时间超过 10 分钟意味着乘客在 7:00-7:05 或 7:15-7:20 之间到达:
P{等车时间>10}=P{0<X<5}+P{15<X<20}=∫05130 dx+∫1520130 dx=530+530=13 \begin{aligned} P\{\text{等车时间} > 10\} &= P\{0 < X < 5\} + P\{15 < X < 20\} \\ &= \int_{0}^{5} \frac{1}{30} \, \mathrm{d}x + \int_{15}^{20} \frac{1}{30} \, \mathrm{d}x \\ &= \frac{5}{30} + \frac{5}{30} = \frac{1}{3} \end{aligned} P{等车时间>10}=P{0<X<5}+P{15<X<20}=∫05301dx+∫1520301dx=305+305=31
例 3d:贝特朗悖论
考虑随机地从圆中取一根弦,该弦的长度大于该圆内接正三角形的边长的概率是多大?
问题:这个概率取决于"随机"的定义方式。
方法一:按弦到圆心的距离
-
弦的位置由它到圆心的距离 DDD 决定,D∈[0,r]D \in [0, r]D∈[0,r]
-
当 D<r/2D < r/2D<r/2 时,弦长 > 内接正三角形边长
-
假设 DDD 在 [0,r][0, r][0,r] 上均匀分布:
P{D<r2}=r/2r=12 P\left\{D < \frac{r}{2}\right\} = \frac{r/2}{r} = \frac{1}{2} P{D<2r}=rr/2=21
方法二:按弦与切线的夹角
-
弦的位置由它与切线的夹角 θ\thetaθ 决定,θ∈[0∘,180∘]\theta \in [0^\circ, 180^\circ]θ∈[0∘,180∘]
-
当 θ∈[60∘,120∘]\theta \in [60^\circ, 120^\circ]θ∈[60∘,120∘] 时,弦长 > 内接正三角形边长
-
假设 θ\thetaθ 在 [0∘,180∘][0^\circ, 180^\circ][0∘,180∘] 上均匀分布:
P{60<θ<120}=120−60180=13 P\{60 < \theta < 120\} = \frac{120 - 60}{180} = \frac{1}{3} P{60<θ<120}=180120−60=31
[!TIP]
贝特朗悖论说明:在概率论中,"随机"的定义必须明确。不同的随机机制可能导致不同的概率结果。
5.4 正态随机变量
定义
如果随机变量 XXX 的密度函数为:
f(x)=12πσe−(x−μ)2/2σ2−∞<x<∞
f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-(x-\mu)^2/2\sigma^2} \qquad -\infty < x < \infty
f(x)=2πσ1e−(x−μ)2/2σ2−∞<x<∞
则称 XXX 是服从参数为 μ\muμ 和 σ2\sigma^2σ2 的正态分布的随机变量,简称为正态随机变量。
特性:
- 密度函数是一条关于 μ\muμ 对称的钟形曲线
- μ\muμ 是分布的均值(期望)
- σ2\sigma^2σ2 是分布的方差
- σ\sigmaσ 是标准差
密度函数
需要验证:
12πσ∫−∞∞e−(x−μ)2/2σ2 dx=1
\frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^{\infty} e^{-(x-\mu)^2/2\sigma^2} \, \mathrm{d}x = 1
2πσ1∫−∞∞e−(x−μ)2/2σ2dx=1
令 y=(x−μ)/σy = (x-\mu)/\sigmay=(x−μ)/σ,则:
12πσ∫−∞∞e−(x−μ)2/2σ2 dx=12π∫−∞∞e−y2/2 dy
\frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^{\infty} e^{-(x-\mu)^2/2\sigma^2} \, \mathrm{d}x = \frac{1}{\sqrt{2\pi}}\int_{-\infty}^{\infty} e^{-y^2/2} \, \mathrm{d}y
2πσ1∫−∞∞e−(x−μ)2/2σ2dx=2π1∫−∞∞e−y2/2dy
计算:
I=∫−∞∞e−y2/2 dyI2=∫−∞∞e−y2/2 dy∫−∞∞e−x2/2 dx=∫−∞∞∫−∞∞e−(x2+y2)/2 dx dy
\begin{aligned}
I &= \int_{-\infty}^{\infty} e^{-y^2/2} \, \mathrm{d}y \\
I^2 &= \int_{-\infty}^{\infty} e^{-y^2/2} \, \mathrm{d}y \int_{-\infty}^{\infty} e^{-x^2/2} \, \mathrm{d}x \\
&= \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} e^{-(x^2+y^2)/2} \, \mathrm{d}x \, \mathrm{d}y
\end{aligned}
II2=∫−∞∞e−y2/2dy=∫−∞∞e−y2/2dy∫−∞∞e−x2/2dx=∫−∞∞∫−∞∞e−(x2+y2)/2dxdy
[!IMPORTANT]
极坐标变换技巧复习
- 坐标变换公式
笛卡尔坐标 极坐标 关系 xxx rcosθr\cos\thetarcosθ x=rcosθx = r\cos\thetax=rcosθ yyy rsinθr\sin\thetarsinθ y=rsinθy = r\sin\thetay=rsinθ x2+y2x^2 + y^2x2+y2 r2r^2r2 r=x2+y2r = \sqrt{x^2 + y^2}r=x2+y2 - θ\thetaθ θ=arctan(y/x)\theta = \arctan(y/x)θ=arctan(y/x)(需考虑象限)
- 面积元素变换(关键!)
在极坐标下,面积元素发生变化:
dx dy=r dr dθ \boxed{dx\,dy = r\,dr\,d\theta} dxdy=rdrdθ
几何解释:在极坐标中,一个小区域的面积近似为扇形,其面积 = 半径 × 弧长 = r⋅(rdθ)⋅dr=r dr dθr \cdot (r d\theta) \cdot dr = r\,dr\,d\thetar⋅(rdθ)⋅dr=rdrdθ
数学解释:通过雅可比行列式计算:
J=∂(x,y)∂(r,θ)=∣∂x∂r∂x∂θ∂y∂r∂y∂θ∣=∣cosθ−rsinθsinθrcosθ∣=r(cos2θ+sin2θ)=r J = \frac{\partial(x,y)}{\partial(r,\theta)} = \begin{vmatrix} \frac{\partial x}{\partial r} & \frac{\partial x}{\partial \theta} \\ \frac{\partial y}{\partial r} & \frac{\partial y}{\partial \theta} \end{vmatrix} = \begin{vmatrix} \cos\theta & -r\sin\theta \\ \sin\theta & r\cos\theta \end{vmatrix} = r(\cos^2\theta + \sin^2\theta) = r J=∂(r,θ)∂(x,y)=∂r∂x∂r∂y∂θ∂x∂θ∂y=cosθsinθ−rsinθrcosθ=r(cos2θ+sin2θ)=r
因此 dx dy=∣J∣ dr dθ=r dr dθdx\,dy = |J|\,dr\,d\theta = r\,dr\,d\thetadxdy=∣J∣drdθ=rdrdθ
积分区域转换
笛卡尔区域 极坐标区域 整个平面 R2\mathbb{R}^2R2 0≤r<∞0 \leq r < \infty0≤r<∞, 0≤θ<2π0 \leq \theta < 2\pi0≤θ<2π 上半平面 y≥0y \geq 0y≥0 0≤r<∞0 \leq r < \infty0≤r<∞, 0≤θ≤π0 \leq \theta \leq \pi0≤θ≤π 第一象限 x≥0,y≥0x \geq 0, y \geq 0x≥0,y≥0 0≤r<∞0 \leq r < \infty0≤r<∞, 0≤θ≤π20 \leq \theta \leq \frac{\pi}{2}0≤θ≤2π 圆盘 x2+y2≤a2x^2 + y^2 \leq a^2x2+y2≤a2 0≤r≤a0 \leq r \leq a0≤r≤a, 0≤θ<2π0 \leq \theta < 2\pi0≤θ<2π
使用极坐标变换 x=rcosθx = r\cos\thetax=rcosθ,y=rsinθy = r\sin\thetay=rsinθ:
I2=∫0∞∫02πe−r2/2r dθ dr=2π∫0∞re−r2/2 dr=−2πe−r2/2∣0∞=2π
\begin{aligned}
I^2 &= \int_{0}^{\infty} \int_{0}^{2\pi} e^{-r^2/2} r \, \mathrm{d}\theta \, \mathrm{d}r \\
&= 2\pi \int_{0}^{\infty} r e^{-r^2/2} \, \mathrm{d}r \\
&= -2\pi e^{-r^2/2} \Big|_{0}^{\infty} \\
&= 2\pi
\end{aligned}
I2=∫0∞∫02πe−r2/2rdθdr=2π∫0∞re−r2/2dr=−2πe−r2/20∞=2π
[!NOTE]
计算角度积分:
∫02πdθ=θ∣02π=2π−0=2π \int_{0}^{2\pi} d\theta = \theta \Big|_{0}^{2\pi} = 2\pi - 0 = 2\pi ∫02πdθ=θ02π=2π−0=2π所以:
I2=2π∫0∞re−r2/2 dr I^2 = 2\pi \int_{0}^{\infty} r e^{-r^2/2} \, dr I2=2π∫0∞re−r2/2dr现在需要计算:
∫0∞re−r2/2 dr \int_{0}^{\infty} r e^{-r^2/2} \, dr ∫0∞re−r2/2dr这是一个典型的可以通过变量替换解决的积分。
令 u=r22u = \frac{r^2}{2}u=2r2,则:
- du=r drdu = r \, drdu=rdr(因为 dudr=r\frac{du}{dr} = rdrdu=r)
- 当 r=0r = 0r=0 时,u=0u = 0u=0
- 当 r→∞r \to \inftyr→∞ 时,u→∞u \to \inftyu→∞
代入得:
∫0∞re−r2/2 dr=∫0∞e−u du \int_{0}^{\infty} r e^{-r^2/2} \, dr = \int_{0}^{\infty} e^{-u} \, du ∫0∞re−r2/2dr=∫0∞e−udu这个积分很简单:
∫0∞e−u du=−e−u∣0∞=−(e−∞−e0)=−(0−1)=1 \int_{0}^{\infty} e^{-u} \, du = -e^{-u} \Big|_{0}^{\infty} = -(e^{-\infty} - e^{0}) = -(0 - 1) = 1 ∫0∞e−udu=−e−u0∞=−(e−∞−e0)=−(0−1)=1I2=2π⋅1=2π I^2 = 2\pi \cdot 1 = 2\pi I2=2π⋅1=2π
因此:
I=2π I = \sqrt{2\pi} I=2π这意味着:
∫−∞∞e−x2/2 dx=2π \int_{-\infty}^{\infty} e^{-x^2/2} \, dx = \sqrt{2\pi} ∫−∞∞e−x2/2dx=2π
因此 I=2πI = \sqrt{2\pi}I=2π,证明了:
12π∫−∞∞e−y2/2 dy=1
\frac{1}{\sqrt{2\pi}}\int_{-\infty}^{\infty} e^{-y^2/2} \, \mathrm{d}y = 1
2π1∫−∞∞e−y2/2dy=1
性质
线性变换
如果 X∼N(μ,σ2)X \sim N(\mu, \sigma^2)X∼N(μ,σ2),则 aX+b∼N(aμ+b,a2σ2)aX + b \sim N(a\mu + b, a^2\sigma^2)aX+b∼N(aμ+b,a2σ2)。
证明:
-
令 Y=aX+bY = aX + bY=aX+b,a>0a > 0a>0(a<0a < 0a<0 时证明类似)
-
YYY 的分布函数:
FY(x)=P{Y≤x}=P{aX+b≤x}=P{X≤x−ba}=FX(x−ba) F_Y(x) = P\{Y \leq x\} = P\{aX + b \leq x\} = P\left\{X \leq \frac{x-b}{a}\right\} = F_X\left(\frac{x-b}{a}\right) FY(x)=P{Y≤x}=P{aX+b≤x}=P{X≤ax−b}=FX(ax−b) -
求导得密度函数:
fY(x)=1afX(x−ba)=12πaσexp{−(x−ba−μ)2/2σ2}=12πaσexp{−(x−b−aμ)2/2(aσ)2} \begin{aligned} f_Y(x) &= \frac{1}{a} f_X\left(\frac{x-b}{a}\right) \\ &= \frac{1}{\sqrt{2\pi a\sigma}} \exp\left\{-\left(\frac{x-b}{a} - \mu\right)^2 / 2\sigma^2\right\} \\ &= \frac{1}{\sqrt{2\pi a\sigma}} \exp\left\{-\left(x - b - a\mu\right)^2 / 2(a\sigma)^2\right\} \end{aligned} fY(x)=a1fX(ax−b)=2πaσ1exp{−(ax−b−μ)2/2σ2}=2πaσ1exp{−(x−b−aμ)2/2(aσ)2} -
这表明 Y∼N(aμ+b,a2σ2)Y \sim N(a\mu + b, a^2\sigma^2)Y∼N(aμ+b,a2σ2)
标准正态分布
如果 X∼N(μ,σ2)X \sim N(\mu, \sigma^2)X∼N(μ,σ2),则 Z=(X−μ)/σ∼N(0,1)Z = (X - \mu)/\sigma \sim N(0, 1)Z=(X−μ)/σ∼N(0,1)。
-
标准正态分布的密度函数为:
fZ(z)=12πe−z2/2 f_Z(z) = \frac{1}{\sqrt{2\pi}} e^{-z^2/2} fZ(z)=2π1e−z2/2 -
分布函数记为 Φ(z)\Phi(z)Φ(z):
Φ(z)=12π∫−∞ze−y2/2 dy \Phi(z) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{z} e^{-y^2/2} \, \mathrm{d}y Φ(z)=2π1∫−∞ze−y2/2dy -
对称性:Φ(−z)=1−Φ(z)\Phi(-z) = 1 - \Phi(z)Φ(−z)=1−Φ(z)
期望与方差
例 4a:设 XXX 是参数为 μ\muμ 和 σ2\sigma^2σ2 的正态随机变量,求 E[X]E[X]E[X] 和 Var(X)Var(X)Var(X)。
-
先计算标准正态变量 ZZZ 的期望:
E[Z]=12π∫−∞∞ze−z2/2 dz=0 E[Z] = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} z e^{-z^2/2} \, \mathrm{d}z = 0 E[Z]=2π1∫−∞∞ze−z2/2dz=0
(奇函数在对称区间上的积分) -
计算 Var(Z)=E[Z2]Var(Z) = E[Z^2]Var(Z)=E[Z2]:
Var(Z)=12π∫−∞∞z2e−z2/2 dz=12π[−ze−z2/2∣−∞∞+∫−∞∞e−z2/2 dz]=12π∫−∞∞e−z2/2 dz=1 \begin{aligned} Var(Z) &= \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} z^2 e^{-z^2/2} \, \mathrm{d}z \\ &= \frac{1}{\sqrt{2\pi}} \left[ -z e^{-z^2/2} \Big|_{-\infty}^{\infty} + \int_{-\infty}^{\infty} e^{-z^2/2} \, \mathrm{d}z \right] \\ &= \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} e^{-z^2/2} \, \mathrm{d}z = 1 \end{aligned} Var(Z)=2π1∫−∞∞z2e−z2/2dz=2π1[−ze−z2/2−∞∞+∫−∞∞e−z2/2dz]=2π1∫−∞∞e−z2/2dz=1 -
由于 X=μ+σZX = \mu + \sigma ZX=μ+σZ:
E[X]=μ+σE[Z]=μVar(X)=σ2Var(Z)=σ2 \begin{aligned} E[X] &= \mu + \sigma E[Z] = \mu \\ Var(X) &= \sigma^2 Var(Z) = \sigma^2 \end{aligned} E[X]Var(X)=μ+σE[Z]=μ=σ2Var(Z)=σ2
[!IMPORTANT]
标准正态分布方差的详细计算
步骤 1:设置积分
Var(Z)=12π∫−∞∞z2e−z2/2 dz Var(Z) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} z^2 e^{-z^2/2} \, dz Var(Z)=2π1∫−∞∞z2e−z2/2dz步骤 2:应用分部积分法
我们需要计算 ∫−∞∞z2e−z2/2 dz\int_{-\infty}^{\infty} z^2 e^{-z^2/2} \, dz∫−∞∞z2e−z2/2dz,使用分部积分法:
回忆分部积分公式:
∫u dv=uv−∫v du \int u \, dv = uv - \int v \, du ∫udv=uv−∫vdu选择:
- 令 u=zu = zu=z,则 du=dzdu = dzdu=dz
- 令 dv=ze−z2/2 dzdv = z e^{-z^2/2} \, dzdv=ze−z2/2dz,则 v=−e−z2/2v = -e^{-z^2/2}v=−e−z2/2(因为 ddz(−e−z2/2)=ze−z2/2\frac{d}{dz}(-e^{-z^2/2}) = z e^{-z^2/2}dzd(−e−z2/2)=ze−z2/2)
应用公式:
∫z2e−z2/2 dz=∫u dv=uv−∫v du=z⋅(−e−z2/2)−∫(−e−z2/2) dz=−ze−z2/2+∫e−z2/2 dz \begin{aligned} \int z^2 e^{-z^2/2} \, dz &= \int u \, dv \\ &= uv - \int v \, du \\ &= z \cdot (-e^{-z^2/2}) - \int (-e^{-z^2/2}) \, dz \\ &= -z e^{-z^2/2} + \int e^{-z^2/2} \, dz \end{aligned} ∫z2e−z2/2dz=∫udv=uv−∫vdu=z⋅(−e−z2/2)−∫(−e−z2/2)dz=−ze−z2/2+∫e−z2/2dz步骤 3:计算定积分
将上述结果应用于定积分:
∫−∞∞z2e−z2/2 dz=[−ze−z2/2]−∞∞+∫−∞∞e−z2/2 dz \int_{-\infty}^{\infty} z^2 e^{-z^2/2} \, dz = \left[ -z e^{-z^2/2} \right]_{-\infty}^{\infty} + \int_{-\infty}^{\infty} e^{-z^2/2} \, dz ∫−∞∞z2e−z2/2dz=[−ze−z2/2]−∞∞+∫−∞∞e−z2/2dz分析边界项 [−ze−z2/2]−∞∞\left[ -z e^{-z^2/2} \right]_{-\infty}^{\infty}[−ze−z2/2]−∞∞:
当 z→∞z \to \inftyz→∞ 时:
limz→∞(−ze−z2/2)=limz→∞−zez2/2 \lim_{z \to \infty} (-z e^{-z^2/2}) = \lim_{z \to \infty} \frac{-z}{e^{z^2/2}} z→∞lim(−ze−z2/2)=z→∞limez2/2−z
这是一个 ∞∞\frac{\infty}{\infty}∞∞ 型不定式,应用洛必达法则:
limz→∞−zez2/2=limz→∞−1zez2/2=0 \lim_{z \to \infty} \frac{-z}{e^{z^2/2}} = \lim_{z \to \infty} \frac{-1}{z e^{z^2/2}} = 0 z→∞limez2/2−z=z→∞limzez2/2−1=0
(分子是常数,分母趋向无穷大)当 z→−∞z \to -\inftyz→−∞ 时:
limz→−∞(−ze−z2/2)=limz→−∞−zez2/2 \lim_{z \to -\infty} (-z e^{-z^2/2}) = \lim_{z \to -\infty} \frac{-z}{e^{z^2/2}} z→−∞lim(−ze−z2/2)=z→−∞limez2/2−z
令 w=−zw = -zw=−z,则 w→∞w \to \inftyw→∞:
limw→∞wew2/2=0 \lim_{w \to \infty} \frac{w}{e^{w^2/2}} = 0 w→∞limew2/2w=0
(同样应用洛必达法则)因此:
[−ze−z2/2]−∞∞=0−0=0 \left[ -z e^{-z^2/2} \right]_{-\infty}^{\infty} = 0 - 0 = 0 [−ze−z2/2]−∞∞=0−0=0步骤 4:简化表达式
代入边界项的结果:
∫−∞∞z2e−z2/2 dz=0+∫−∞∞e−z2/2 dz=∫−∞∞e−z2/2 dz \int_{-\infty}^{\infty} z^2 e^{-z^2/2} \, dz = 0 + \int_{-\infty}^{\infty} e^{-z^2/2} \, dz = \int_{-\infty}^{\infty} e^{-z^2/2} \, dz ∫−∞∞z2e−z2/2dz=0+∫−∞∞e−z2/2dz=∫−∞∞e−z2/2dz步骤 5:应用高斯积分结果
从之前的讨论(极坐标变换)我们知道:
∫−∞∞e−z2/2 dz=2π \int_{-\infty}^{\infty} e^{-z^2/2} \, dz = \sqrt{2\pi} ∫−∞∞e−z2/2dz=2π将结果代入方差公式:
Var(Z)=12π∫−∞∞z2e−z2/2 dz=12π∫−∞∞e−z2/2 dz=12π⋅2π=1 \begin{aligned} Var(Z) &= \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} z^2 e^{-z^2/2} \, dz \\ &= \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} e^{-z^2/2} \, dz \\ &= \frac{1}{\sqrt{2\pi}} \cdot \sqrt{2\pi} \\ &= 1 \end{aligned} Var(Z)=2π1∫−∞∞z2e−z2/2dz=2π1∫−∞∞e−z2/2dz=2π1⋅2π=1
例题
例 4b:如果 XXX 服从正态分布,参数为 μ=3\mu=3μ=3 和 σ2=9\sigma^2 = 9σ2=9(即 σ=3\sigma = 3σ=3),求:
-
(a) P{2≤X≤5}P\{2 \leq X \leq 5\}P{2≤X≤5}:
P{2<X<5}=P{2−33<X−33<5−33}=P{−13<Z<23}=Φ(23)−Φ(−13)=Φ(23)−[1−Φ(13)]≈0.7486−(1−0.6293)=0.3779 \begin{aligned} P\{2 < X < 5\} &= P\left\{\frac{2-3}{3} < \frac{X-3}{3} < \frac{5-3}{3}\right\} \\ &= P\left\{-\frac{1}{3} < Z < \frac{2}{3}\right\} \\ &= \Phi\left(\frac{2}{3}\right) - \Phi\left(-\frac{1}{3}\right) \\ &= \Phi\left(\frac{2}{3}\right) - \left[1 - \Phi\left(\frac{1}{3}\right)\right] \\ &\approx 0.7486 - (1 - 0.6293) = 0.3779 \end{aligned} P{2<X<5}=P{32−3<3X−3<35−3}=P{−31<Z<32}=Φ(32)−Φ(−31)=Φ(32)−[1−Φ(31)]≈0.7486−(1−0.6293)=0.3779 -
(b) P{X>0}P\{X > 0\}P{X>0}:
P{X>0}=P{X−33>0−33}=P{Z>−1}=1−Φ(−1)=Φ(1)≈0.8413 \begin{aligned} P\{X > 0\} &= P\left\{\frac{X-3}{3} > \frac{0-3}{3}\right\} \\ &= P\{Z > -1\} \\ &= 1 - \Phi(-1) \\ &= \Phi(1) \approx 0.8413 \end{aligned} P{X>0}=P{3X−3>30−3}=P{Z>−1}=1−Φ(−1)=Φ(1)≈0.8413 -
© P{∣X−3∣>6}P\{|X-3| > 6\}P{∣X−3∣>6}:
P{∣X−3∣>6}=P{X>9}+P{X<−3}=P{Z>2}+P{Z<−2}=[1−Φ(2)]+Φ(−2)=2[1−Φ(2)]≈2(1−0.9772)=0.0456 \begin{aligned} P\{|X-3| > 6\} &= P\{X > 9\} + P\{X < -3\} \\ &= P\{Z > 2\} + P\{Z < -2\} \\ &= [1 - \Phi(2)] + \Phi(-2) \\ &= 2[1 - \Phi(2)] \approx 2(1 - 0.9772) = 0.0456 \end{aligned} P{∣X−3∣>6}=P{X>9}+P{X<−3}=P{Z>2}+P{Z<−2}=[1−Φ(2)]+Φ(−2)=2[1−Φ(2)]≈2(1−0.9772)=0.0456
例 4c:考试分数的等级划分
如果考试分数服从正态分布 N(μ,σ2)N(\mu, \sigma^2)N(μ,σ2),则:
- A等(超过 μ+σ\mu+\sigmaμ+σ):P{X>μ+σ}=1−Φ(1)≈0.1587P\{X > \mu + \sigma\} = 1 - \Phi(1) \approx 0.1587P{X>μ+σ}=1−Φ(1)≈0.1587
- B等(μ\muμ 到 μ+σ\mu+\sigmaμ+σ):P{μ<X<μ+σ}=Φ(1)−Φ(0)≈0.3413P\{\mu < X < \mu + \sigma\} = \Phi(1) - \Phi(0) \approx 0.3413P{μ<X<μ+σ}=Φ(1)−Φ(0)≈0.3413
- C等(μ−σ\mu-\sigmaμ−σ 到 μ\muμ):P{μ−σ<X<μ}=Φ(0)−Φ(−1)≈0.3413P\{\mu - \sigma < X < \mu\} = \Phi(0) - \Phi(-1) \approx 0.3413P{μ−σ<X<μ}=Φ(0)−Φ(−1)≈0.3413
- D等(μ−2σ\mu-2\sigmaμ−2σ 到 μ−σ\mu-\sigmaμ−σ):P{μ−2σ<X<μ−σ}=Φ(1)−Φ(2)≈0.1359P\{\mu - 2\sigma < X < \mu - \sigma\} = \Phi(1) - \Phi(2) \approx 0.1359P{μ−2σ<X<μ−σ}=Φ(1)−Φ(2)≈0.1359
- E等(低于 μ−2σ\mu-2\sigmaμ−2σ):P{X<μ−2σ}=Φ(−2)≈0.0228P\{X < \mu - 2\sigma\} = \Phi(-2) \approx 0.0228P{X<μ−2σ}=Φ(−2)≈0.0228
因此,近似地:
- A等:16%
- B等:34%
- C等:34%
- D等:14%
- E等:2%
例 4d:怀孕期问题
母亲的怀孕期 X∼N(270,100)X \sim N(270, 100)X∼N(270,100)(即 μ=270\mu = 270μ=270,σ=10\sigma = 10σ=10)。
如果被告是孩子的父亲,母亲在被告出国前或回国后怀孕的概率:
P{X>290 或 X<240}=P{X>290}+P{X<240}=P{X−27010>2}+P{X−27010<−3}=[1−Φ(2)]+Φ(−3)≈(1−0.9772)+0.0013=0.0241
\begin{aligned}
P\{X > 290 \text{ 或 } X < 240\} &= P\{X > 290\} + P\{X < 240\} \\
&= P\left\{\frac{X-270}{10} > 2\right\} + P\left\{\frac{X-270}{10} < -3\right\} \\
&= [1 - \Phi(2)] + \Phi(-3) \\
&\approx (1 - 0.9772) + 0.0013 = 0.0241
\end{aligned}
P{X>290 或 X<240}=P{X>290}+P{X<240}=P{10X−270>2}+P{10X−270<−3}=[1−Φ(2)]+Φ(−3)≈(1−0.9772)+0.0013=0.0241
例 4e:电信信号传输
当传送信息为 1 时发送值 2,为 0 时发送值 -2。接收值 R=x+NR = x + NR=x+N,其中 N∼N(0,1)N \sim N(0,1)N∼N(0,1)。
-
信息 1 被错误认为 0 的概率(当 R<0.5R < 0.5R<0.5):
P{2+N<0.5}=P{N<−1.5}=1−Φ(1.5)≈0.0668 P\{2 + N < 0.5\} = P\{N < -1.5\} = 1 - \Phi(1.5) \approx 0.0668 P{2+N<0.5}=P{N<−1.5}=1−Φ(1.5)≈0.0668 -
信息 0 被错误认为 1 的概率(当 R≥0.5R \geq 0.5R≥0.5):
P{−2+N≥0.5}=P{N≥2.5}=1−Φ(2.5)≈0.0062 P\{-2 + N \geq 0.5\} = P\{N \geq 2.5\} = 1 - \Phi(2.5) \approx 0.0062 P{−2+N≥0.5}=P{N≥2.5}=1−Φ(2.5)≈0.0062
正态近似
棣莫弗-拉普拉斯极限定理
在 nnn 次独立重复试验中,设每次成功的概率为 ppp,记成功总次数为 SnS_nSn,则对任意 a<ba < ba<b:
P{a⩽Sn−npnp(1−p)⩽b}→Φ(b)−Φ(a)当 n→∞ P\left\{a \leqslant \frac{S_n - np}{\sqrt{np(1-p)}} \leqslant b\right\} \to \Phi(b) - \Phi(a) \quad \text{当 } n \to \infty P{a⩽np(1−p)Sn−np⩽b}→Φ(b)−Φ(a)当 n→∞
使用条件:
- 当 np(1−p)≥10np(1-p) \geq 10np(1−p)≥10 时,正态近似效果很好
- 需要进行连续性修正(因为二项分布是离散的,而正态分布是连续的)
连续性修正:
- P{Sn=i}≈P{i−0.5<X<i+0.5}P\{S_n = i\} \approx P\{i-0.5 < X < i+0.5\}P{Sn=i}≈P{i−0.5<X<i+0.5},其中 XXX 为正态变量
例 4g:抛 40 次均匀硬币
设 XXX 为正面次数,X∼Binomial(40,0.5)X \sim \text{Binomial}(40, 0.5)X∼Binomial(40,0.5)。
-
正态近似:
P{X=20}=P{19.5<X<20.5}=P{19.5−2010<X−2010<20.5−2010}≈P{−0.16<Z<0.16}=Φ(0.16)−Φ(−0.16)≈0.1272 \begin{aligned} P\{X = 20\} &= P\{19.5 < X < 20.5\} \\ &= P\left\{\frac{19.5 - 20}{\sqrt{10}} < \frac{X - 20}{\sqrt{10}} < \frac{20.5 - 20}{\sqrt{10}}\right\} \\ &\approx P\{-0.16 < Z < 0.16\} \\ &= \Phi(0.16) - \Phi(-0.16) \approx 0.1272 \end{aligned} P{X=20}=P{19.5<X<20.5}=P{1019.5−20<10X−20<1020.5−20}≈P{−0.16<Z<0.16}=Φ(0.16)−Φ(−0.16)≈0.1272 -
精确解:
P{X=20}=(4020)(12)40≈0.1254 P\{X = 20\} = \binom{40}{20} \left(\frac{1}{2}\right)^{40} \approx 0.1254 P{X=20}=(2040)(21)40≈0.1254
例 4h:学院招生问题
设 XXX 为入学新生人数,X∼Binomial(450,0.3)X \sim \text{Binomial}(450, 0.3)X∼Binomial(450,0.3)。
- 正态近似:
P{X≥150}≈P{X≥150.5}=P{X−450×0.3450×0.3×0.7≥150.5−13594.5}=P{Z≥15.59.72}=P{Z≥1.59}≈1−Φ(1.59)≈0.0559 \begin{aligned} P\{X \geq 150\} &\approx P\{X \geq 150.5\} \\ &= P\left\{\frac{X - 450 \times 0.3}{\sqrt{450 \times 0.3 \times 0.7}} \geq \frac{150.5 - 135}{\sqrt{94.5}}\right\} \\ &= P\left\{Z \geq \frac{15.5}{9.72}\right\} \\ &= P\{Z \geq 1.59\} \\ &\approx 1 - \Phi(1.59) \approx 0.0559 \end{aligned} P{X≥150}≈P{X≥150.5}=P{450×0.3×0.7X−450×0.3≥94.5150.5−135}=P{Z≥9.7215.5}=P{Z≥1.59}≈1−Φ(1.59)≈0.0559
因此,入学新生超过 150 名的概率约为 5.59%。
例 4i:胆固醇试验
设 XXX 为胆固醇降低的人数,X∼Binomial(100,0.5)X \sim \text{Binomial}(100, 0.5)X∼Binomial(100,0.5)(假设食品无效)。
- 正态近似:
P{X≥65}≈P{X≥64.5}=P{X−505≥64.5−505}=P{Z≥2.9}≈1−Φ(2.9)≈0.0019 \begin{aligned} P\{X \geq 65\} &\approx P\{X \geq 64.5\} \\ &= P\left\{\frac{X - 50}{5} \geq \frac{64.5 - 50}{5}\right\} \\ &= P\{Z \geq 2.9\} \\ &\approx 1 - \Phi(2.9) \approx 0.0019 \end{aligned} P{X≥65}≈P{X≥64.5}=P{5X−50≥564.5−50}=P{Z≥2.9}≈1−Φ(2.9)≈0.0019
因此,即使食品无效,营养学家仍承认它有效的概率约为 0.19%。
例 4j:纽约市民支持率
设 SnS_nSn 为支持禁令的人数,Sn∼Binomial(n,0.52)S_n \sim \text{Binomial}(n, 0.52)Sn∼Binomial(n,0.52)。
-
正态近似:
P{Sn>0.5n}=P{Sn−0.52nn×0.52×0.48>0.5n−0.52nn×0.52×0.48}=P{Z>−0.04n}=Φ(0.04n) \begin{aligned} P\{S_n > 0.5n\} &= P\left\{\frac{S_n - 0.52n}{\sqrt{n \times 0.52 \times 0.48}} > \frac{0.5n - 0.52n}{\sqrt{n \times 0.52 \times 0.48}}\right\} \\ &= P\left\{Z > -0.04\sqrt{n}\right\} \\ &= \Phi(0.04\sqrt{n}) \end{aligned} P{Sn>0.5n}=P{n×0.52×0.48Sn−0.52n>n×0.52×0.480.5n−0.52n}=P{Z>−0.04n}=Φ(0.04n) -
计算:
- n=11n = 11n=11:Φ(0.1328)≈0.5528\Phi(0.1328) \approx 0.5528Φ(0.1328)≈0.5528
- n=101n = 101n=101:Φ(0.4020)≈0.6562\Phi(0.4020) \approx 0.6562Φ(0.4020)≈0.6562
- n=1001n = 1001n=1001:Φ(1.2665)≈0.8973\Phi(1.2665) \approx 0.8973Φ(1.2665)≈0.8973
-
为使概率 > 0.95:
Φ(0.04n)>0.95⇒0.04n>1.645⇒n≥1692 \Phi(0.04\sqrt{n}) > 0.95 \Rightarrow 0.04\sqrt{n} > 1.645 \Rightarrow n \geq 1692 Φ(0.04n)>0.95⇒0.04n>1.645⇒n≥1692
本节小结
特性 | 公式 |
---|---|
密度函数 | f(x)={1β−αα<x<β0其他f(x) = \begin{cases} \frac{1}{\beta-\alpha} & \alpha < x < \beta \\ 0 & \text{其他} \end{cases}f(x)={β−α10α<x<β其他 |
分布函数 | F(a)={0a≤αa−αβ−αα<a<β1a≥βF(a) = \begin{cases} 0 & a \leq \alpha \\ \frac{a-\alpha}{\beta-\alpha} & \alpha < a < \beta \\ 1 & a \geq \beta \end{cases}F(a)=⎩⎨⎧0β−αa−α1a≤αα<a<βa≥β |
期望 | E[X]=α+β2E[X] = \frac{\alpha + \beta}{2}E[X]=2α+β |
方差 | Var(X)=(β−α)212Var(X) = \frac{(\beta - \alpha)^2}{12}Var(X)=12(β−α)2 |
正态随机变量
特性 | 公式 |
---|---|
密度函数 | f(x)=12πσe−(x−μ)2/2σ2f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-(x-\mu)^2/2\sigma^2}f(x)=2πσ1e−(x−μ)2/2σ2 |
标准正态分布 | Z=X−μσ∼N(0,1)Z = \frac{X-\mu}{\sigma} \sim N(0,1)Z=σX−μ∼N(0,1) |
分布函数 | Φ(z)=12π∫−∞ze−y2/2 dy\Phi(z) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{z} e^{-y^2/2} \, \mathrm{d}yΦ(z)=2π1∫−∞ze−y2/2dy |
对称性 | Φ(−z)=1−Φ(z)\Phi(-z) = 1 - \Phi(z)Φ(−z)=1−Φ(z) |
期望 | E[X]=μE[X] = \muE[X]=μ |
方差 | Var(X)=σ2Var(X) = \sigma^2Var(X)=σ2 |
线性变换 | aX+b∼N(aμ+b,a2σ2)aX + b \sim N(a\mu + b, a^2\sigma^2)aX+b∼N(aμ+b,a2σ2) |
二项分布的正态近似
- 条件:np(1−p)≥10np(1-p) \geq 10np(1−p)≥10
- 连续性修正:P{Sn=i}≈P{i−0.5<X<i+0.5}P\{S_n = i\} \approx P\{i-0.5 < X < i+0.5\}P{Sn=i}≈P{i−0.5<X<i+0.5}
- 标准化:Sn−npnp(1−p)≈N(0,1)\frac{S_n - np}{\sqrt{np(1-p)}} \approx N(0,1)np(1−p)Sn−np≈N(0,1)概率论基础教程第5章 连续型随机变量(一)