当前位置: 首页 > news >正文

概率论基础教程第5章 连续型随机变量(二)

5.3 均匀随机变量

定义与性质

均匀随机变量是最简单的连续型随机变量,其概率密度函数在整个定义区间内为常数。

(0,1)区间

如果随机变量 XXX 的密度函数为:
f(x)={10<x<10其他(3.1) f(x) = \begin{cases} 1 & 0 < x < 1 \\ 0 & \text{其他} \end{cases} \tag{3.1} f(x)={100<x<1其他(3.1)

则称 XXX(0,1)(0,1)(0,1) 区间上均匀分布

验证

  • f(x)≥0f(x) \geq 0f(x)0 对所有 xxx 成立
  • ∫−∞∞f(x) dx=∫011 dx=1\int_{-\infty}^{\infty} f(x) \, \mathrm{d}x = \int_{0}^{1} 1 \, \mathrm{d}x = 1f(x)dx=011dx=1

一般区间

更一般地,如果随机变量 XXX 的密度函数为:
f(x)={1β−αα<x<β0其他(3.2) f(x) = \begin{cases} \frac{1}{\beta - \alpha} & \alpha < x < \beta \\ 0 & \text{其他} \end{cases} \tag{3.2} f(x)={βα10α<x<β其他(3.2)

则称 XXX 在区间 (α,β)(\alpha, \beta)(α,β)均匀分布

直观理解

  • 由于 f(x)f(x)f(x)(α,β)(\alpha, \beta)(α,β) 内为常数,XXX 在区间内任何位置取值的概率密度相同

  • 对任意 a,ba, ba,b 满足 α≤a<b≤β\alpha \leq a < b \leq \betaαa<bβ
    P{a⩽X⩽b}=∫abf(x) dx=b−aβ−α P\{a \leqslant X \leqslant b\} = \int_a^b f(x) \, \mathrm{d}x = \frac{b-a}{\beta-\alpha} P{aXb}=abf(x)dx=βαba

  • 这表明 XXX 属于 (α,β)(\alpha, \beta)(α,β) 的任一子区间的概率等于该子区间长度与总区间长度的比值

分布函数

区间 (α,β)(\alpha, \beta)(α,β) 上均匀随机变量的分布函数为:
F(a)={0a≤αa−αβ−αα<a<β1a≥β F(a) = \begin{cases} 0 & a \leq \alpha \\ \frac{a-\alpha}{\beta-\alpha} & \alpha < a < \beta \\ 1 & a \geq \beta \end{cases} F(a)=0βαaα1aαα<a<βaβ

期望

E[X]=∫−∞∞xf(x) dx=∫αβxβ−α dx=1β−α[x22]αβ=β2−α22(β−α)=(β−α)(β+α)2(β−α)=β+α2 \begin{aligned} E[X] &= \int_{-\infty}^{\infty} x f(x) \, \mathrm{d}x \\ &= \int_{\alpha}^{\beta} \frac{x}{\beta - \alpha} \, \mathrm{d}x \\ &= \frac{1}{\beta - \alpha} \left[ \frac{x^2}{2} \right]_{\alpha}^{\beta} \\ &= \frac{\beta^2 - \alpha^2}{2(\beta - \alpha)} \\ &= \frac{(\beta - \alpha)(\beta + \alpha)}{2(\beta - \alpha)} \\ &= \frac{\beta + \alpha}{2} \end{aligned} E[X]=xf(x)dx=αββαxdx=βα1[2x2]αβ=2(βα)β2α2=2(βα)(βα)(β+α)=2β+α

方差

首先计算 E[X2]E[X^2]E[X2]
E[X2]=∫αβx2β−α dx=1β−α[x33]αβ=β3−α33(β−α)=(β−α)(β2+αβ+α2)3(β−α)=β2+αβ+α23 \begin{aligned} E[X^2] &= \int_{\alpha}^{\beta} \frac{x^2}{\beta - \alpha} \, \mathrm{d}x \\ &= \frac{1}{\beta - \alpha} \left[ \frac{x^3}{3} \right]_{\alpha}^{\beta} \\ &= \frac{\beta^3 - \alpha^3}{3(\beta - \alpha)} \\ &= \frac{(\beta - \alpha)(\beta^2 + \alpha\beta + \alpha^2)}{3(\beta - \alpha)} \\ &= \frac{\beta^2 + \alpha\beta + \alpha^2}{3} \end{aligned} E[X2]=αββαx2dx=βα1[3x3]αβ=3(βα)β3α3=3(βα)(βα)(β2+αβ+α2)=3β2+αβ+α2

然后计算方差:
Var(X)=E[X2]−(E[X])2=β2+αβ+α23−(β+α2)2=4(β2+αβ+α2)−3(β2+2αβ+α2)12=4β2+4αβ+4α2−3β2−6αβ−3α212=β2−2αβ+α212=(β−α)212 \begin{aligned} Var(X) &= E[X^2] - (E[X])^2 \\ &= \frac{\beta^2 + \alpha\beta + \alpha^2}{3} - \left(\frac{\beta + \alpha}{2}\right)^2 \\ &= \frac{4(\beta^2 + \alpha\beta + \alpha^2) - 3(\beta^2 + 2\alpha\beta + \alpha^2)}{12} \\ &= \frac{4\beta^2 + 4\alpha\beta + 4\alpha^2 - 3\beta^2 - 6\alpha\beta - 3\alpha^2}{12} \\ &= \frac{\beta^2 - 2\alpha\beta + \alpha^2}{12} \\ &= \frac{(\beta - \alpha)^2}{12} \end{aligned} Var(X)=E[X2](E[X])2=3β2+αβ+α2(2β+α)2=124(β2+αβ+α2)3(β2+2αβ+α2)=124β2+4αβ+4α23β26αβ3α2=12β22αβ+α2=12(βα)2

例题

例 3b:如果 XXX 服从 (0,10)(0, 10)(0,10) 上的均匀分布,计算:

  • (a) P{X<3}P\{X < 3\}P{X<3}
    P{X<3}=∫03110 dx=310 P\{X < 3\} = \int_{0}^{3} \frac{1}{10} \, \mathrm{d}x = \frac{3}{10} P{X<3}=03101dx=103

  • (b) P{X>6}P\{X > 6\}P{X>6}
    P{X>6}=∫610110 dx=410 P\{X > 6\} = \int_{6}^{10} \frac{1}{10} \, \mathrm{d}x = \frac{4}{10} P{X>6}=610101dx=104

  • © P{3<X<8}P\{3 < X < 8\}P{3<X<8}
    P{3<X<8}=∫38110 dx=510=12 P\{3 < X < 8\} = \int_{3}^{8} \frac{1}{10} \, \mathrm{d}x = \frac{5}{10} = \frac{1}{2} P{3<X<8}=38101dx=105=21


例 3c:某乘客在 7:00 到 7:30 之间到达车站的时间服从均匀分布,求:

  • (a) 等车时间不超过 5 分钟的概率

    假设公交车在 7:00, 7:15, 7:30 等时间点发车,等车时间不超过 5 分钟意味着乘客在 7:10-7:15 或 7:25-7:30 之间到达:
    P{等车时间≤5}=P{10<X<15}+P{25<X<30}=∫1015130 dx+∫2530130 dx=530+530=13 \begin{aligned} P\{\text{等车时间} \leq 5\} &= P\{10 < X < 15\} + P\{25 < X < 30\} \\ &= \int_{10}^{15} \frac{1}{30} \, \mathrm{d}x + \int_{25}^{30} \frac{1}{30} \, \mathrm{d}x \\ &= \frac{5}{30} + \frac{5}{30} = \frac{1}{3} \end{aligned} P{等车时间5}=P{10<X<15}+P{25<X<30}=1015301dx+2530301dx=305+305=31

  • (b) 等车时间超过 10 分钟的概率

    等车时间超过 10 分钟意味着乘客在 7:00-7:05 或 7:15-7:20 之间到达:
    P{等车时间>10}=P{0<X<5}+P{15<X<20}=∫05130 dx+∫1520130 dx=530+530=13 \begin{aligned} P\{\text{等车时间} > 10\} &= P\{0 < X < 5\} + P\{15 < X < 20\} \\ &= \int_{0}^{5} \frac{1}{30} \, \mathrm{d}x + \int_{15}^{20} \frac{1}{30} \, \mathrm{d}x \\ &= \frac{5}{30} + \frac{5}{30} = \frac{1}{3} \end{aligned} P{等车时间>10}=P{0<X<5}+P{15<X<20}=05301dx+1520301dx=305+305=31


例 3d:贝特朗悖论

考虑随机地从圆中取一根弦,该弦的长度大于该圆内接正三角形的边长的概率是多大?

问题:这个概率取决于"随机"的定义方式。

方法一:按弦到圆心的距离

  • 弦的位置由它到圆心的距离 DDD 决定,D∈[0,r]D \in [0, r]D[0,r]

  • D<r/2D < r/2D<r/2 时,弦长 > 内接正三角形边长

  • 假设 DDD[0,r][0, r][0,r] 上均匀分布:
    P{D<r2}=r/2r=12 P\left\{D < \frac{r}{2}\right\} = \frac{r/2}{r} = \frac{1}{2} P{D<2r}=rr/2=21

方法二:按弦与切线的夹角

  • 弦的位置由它与切线的夹角 θ\thetaθ 决定,θ∈[0∘,180∘]\theta \in [0^\circ, 180^\circ]θ[0,180]

  • θ∈[60∘,120∘]\theta \in [60^\circ, 120^\circ]θ[60,120] 时,弦长 > 内接正三角形边长

  • 假设 θ\thetaθ[0∘,180∘][0^\circ, 180^\circ][0,180] 上均匀分布:
    P{60<θ<120}=120−60180=13 P\{60 < \theta < 120\} = \frac{120 - 60}{180} = \frac{1}{3} P{60<θ<120}=18012060=31

[!TIP]
贝特朗悖论说明:在概率论中,"随机"的定义必须明确。不同的随机机制可能导致不同的概率结果。


5.4 正态随机变量

定义

如果随机变量 XXX 的密度函数为:
f(x)=12πσe−(x−μ)2/2σ2−∞<x<∞ f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-(x-\mu)^2/2\sigma^2} \qquad -\infty < x < \infty f(x)=2πσ1e(xμ)2/2σ2<x<

则称 XXX 是服从参数为 μ\muμσ2\sigma^2σ2正态分布的随机变量,简称为正态随机变量

特性

  • 密度函数是一条关于 μ\muμ 对称的钟形曲线
  • μ\muμ 是分布的均值(期望)
  • σ2\sigma^2σ2 是分布的方差
  • σ\sigmaσ 是标准差

密度函数

需要验证:
12πσ∫−∞∞e−(x−μ)2/2σ2 dx=1 \frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^{\infty} e^{-(x-\mu)^2/2\sigma^2} \, \mathrm{d}x = 1 2πσ1e(xμ)2/2σ2dx=1

y=(x−μ)/σy = (x-\mu)/\sigmay=(xμ)/σ,则:
12πσ∫−∞∞e−(x−μ)2/2σ2 dx=12π∫−∞∞e−y2/2 dy \frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^{\infty} e^{-(x-\mu)^2/2\sigma^2} \, \mathrm{d}x = \frac{1}{\sqrt{2\pi}}\int_{-\infty}^{\infty} e^{-y^2/2} \, \mathrm{d}y 2πσ1e(xμ)2/2σ2dx=2π1ey2/2dy

计算:
I=∫−∞∞e−y2/2 dyI2=∫−∞∞e−y2/2 dy∫−∞∞e−x2/2 dx=∫−∞∞∫−∞∞e−(x2+y2)/2 dx dy \begin{aligned} I &= \int_{-\infty}^{\infty} e^{-y^2/2} \, \mathrm{d}y \\ I^2 &= \int_{-\infty}^{\infty} e^{-y^2/2} \, \mathrm{d}y \int_{-\infty}^{\infty} e^{-x^2/2} \, \mathrm{d}x \\ &= \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} e^{-(x^2+y^2)/2} \, \mathrm{d}x \, \mathrm{d}y \end{aligned} II2=ey2/2dy=ey2/2dyex2/2dx=e(x2+y2)/2dxdy

[!IMPORTANT]

极坐标变换技巧复习

  1. 坐标变换公式
笛卡尔坐标极坐标关系
xxxrcos⁡θr\cos\thetarcosθx=rcos⁡θx = r\cos\thetax=rcosθ
yyyrsin⁡θr\sin\thetarsinθy=rsin⁡θy = r\sin\thetay=rsinθ
x2+y2x^2 + y^2x2+y2r2r^2r2r=x2+y2r = \sqrt{x^2 + y^2}r=x2+y2
-θ\thetaθθ=arctan⁡(y/x)\theta = \arctan(y/x)θ=arctan(y/x)(需考虑象限)
  1. 面积元素变换(关键!)

在极坐标下,面积元素发生变化:
dx dy=r dr dθ \boxed{dx\,dy = r\,dr\,d\theta} dxdy=rdrdθ

  • 几何解释:在极坐标中,一个小区域的面积近似为扇形,其面积 = 半径 × 弧长 = r⋅(rdθ)⋅dr=r dr dθr \cdot (r d\theta) \cdot dr = r\,dr\,d\thetar(rdθ)dr=rdrdθ

  • 数学解释:通过雅可比行列式计算:
    J=∂(x,y)∂(r,θ)=∣∂x∂r∂x∂θ∂y∂r∂y∂θ∣=∣cos⁡θ−rsin⁡θsin⁡θrcos⁡θ∣=r(cos⁡2θ+sin⁡2θ)=r J = \frac{\partial(x,y)}{\partial(r,\theta)} = \begin{vmatrix} \frac{\partial x}{\partial r} & \frac{\partial x}{\partial \theta} \\ \frac{\partial y}{\partial r} & \frac{\partial y}{\partial \theta} \end{vmatrix} = \begin{vmatrix} \cos\theta & -r\sin\theta \\ \sin\theta & r\cos\theta \end{vmatrix} = r(\cos^2\theta + \sin^2\theta) = r J=(r,θ)(x,y)=rxryθxθy=cosθsinθrsinθrcosθ=r(cos2θ+sin2θ)=r
    因此 dx dy=∣J∣ dr dθ=r dr dθdx\,dy = |J|\,dr\,d\theta = r\,dr\,d\thetadxdy=Jdrdθ=rdrdθ


积分区域转换

笛卡尔区域极坐标区域
整个平面 R2\mathbb{R}^2R20≤r<∞0 \leq r < \infty0r<, 0≤θ<2π0 \leq \theta < 2\pi0θ<2π
上半平面 y≥0y \geq 0y00≤r<∞0 \leq r < \infty0r<, 0≤θ≤π0 \leq \theta \leq \pi0θπ
第一象限 x≥0,y≥0x \geq 0, y \geq 0x0,y00≤r<∞0 \leq r < \infty0r<, 0≤θ≤π20 \leq \theta \leq \frac{\pi}{2}0θ2π
圆盘 x2+y2≤a2x^2 + y^2 \leq a^2x2+y2a20≤r≤a0 \leq r \leq a0ra, 0≤θ<2π0 \leq \theta < 2\pi0θ<2π

使用极坐标变换 x=rcos⁡θx = r\cos\thetax=rcosθy=rsin⁡θy = r\sin\thetay=rsinθ
I2=∫0∞∫02πe−r2/2r dθ dr=2π∫0∞re−r2/2 dr=−2πe−r2/2∣0∞=2π \begin{aligned} I^2 &= \int_{0}^{\infty} \int_{0}^{2\pi} e^{-r^2/2} r \, \mathrm{d}\theta \, \mathrm{d}r \\ &= 2\pi \int_{0}^{\infty} r e^{-r^2/2} \, \mathrm{d}r \\ &= -2\pi e^{-r^2/2} \Big|_{0}^{\infty} \\ &= 2\pi \end{aligned} I2=002πer2/2rdθdr=2π0rer2/2dr=2πer2/20=2π

[!NOTE]

计算角度积分:
∫02πdθ=θ∣02π=2π−0=2π \int_{0}^{2\pi} d\theta = \theta \Big|_{0}^{2\pi} = 2\pi - 0 = 2\pi 02πdθ=θ02π=2π0=2π

所以:
I2=2π∫0∞re−r2/2 dr I^2 = 2\pi \int_{0}^{\infty} r e^{-r^2/2} \, dr I2=2π0rer2/2dr

现在需要计算:
∫0∞re−r2/2 dr \int_{0}^{\infty} r e^{-r^2/2} \, dr 0rer2/2dr

这是一个典型的可以通过变量替换解决的积分。

u=r22u = \frac{r^2}{2}u=2r2,则:

  • du=r drdu = r \, drdu=rdr(因为 dudr=r\frac{du}{dr} = rdrdu=r
  • r=0r = 0r=0 时,u=0u = 0u=0
  • r→∞r \to \inftyr 时,u→∞u \to \inftyu

代入得:
∫0∞re−r2/2 dr=∫0∞e−u du \int_{0}^{\infty} r e^{-r^2/2} \, dr = \int_{0}^{\infty} e^{-u} \, du 0rer2/2dr=0eudu

这个积分很简单:
∫0∞e−u du=−e−u∣0∞=−(e−∞−e0)=−(0−1)=1 \int_{0}^{\infty} e^{-u} \, du = -e^{-u} \Big|_{0}^{\infty} = -(e^{-\infty} - e^{0}) = -(0 - 1) = 1 0eudu=eu0=(ee0)=(01)=1

I2=2π⋅1=2π I^2 = 2\pi \cdot 1 = 2\pi I2=2π1=2π

因此:
I=2π I = \sqrt{2\pi} I=2π

这意味着:
∫−∞∞e−x2/2 dx=2π \int_{-\infty}^{\infty} e^{-x^2/2} \, dx = \sqrt{2\pi} ex2/2dx=2π

因此 I=2πI = \sqrt{2\pi}I=2π,证明了:
12π∫−∞∞e−y2/2 dy=1 \frac{1}{\sqrt{2\pi}}\int_{-\infty}^{\infty} e^{-y^2/2} \, \mathrm{d}y = 1 2π1ey2/2dy=1


性质

线性变换

如果 X∼N(μ,σ2)X \sim N(\mu, \sigma^2)XN(μ,σ2),则 aX+b∼N(aμ+b,a2σ2)aX + b \sim N(a\mu + b, a^2\sigma^2)aX+bN(aμ+b,a2σ2)

证明

  • Y=aX+bY = aX + bY=aX+ba>0a > 0a>0a<0a < 0a<0 时证明类似)

  • YYY 的分布函数:
    FY(x)=P{Y≤x}=P{aX+b≤x}=P{X≤x−ba}=FX(x−ba) F_Y(x) = P\{Y \leq x\} = P\{aX + b \leq x\} = P\left\{X \leq \frac{x-b}{a}\right\} = F_X\left(\frac{x-b}{a}\right) FY(x)=P{Yx}=P{aX+bx}=P{Xaxb}=FX(axb)

  • 求导得密度函数:
    fY(x)=1afX(x−ba)=12πaσexp⁡{−(x−ba−μ)2/2σ2}=12πaσexp⁡{−(x−b−aμ)2/2(aσ)2} \begin{aligned} f_Y(x) &= \frac{1}{a} f_X\left(\frac{x-b}{a}\right) \\ &= \frac{1}{\sqrt{2\pi a\sigma}} \exp\left\{-\left(\frac{x-b}{a} - \mu\right)^2 / 2\sigma^2\right\} \\ &= \frac{1}{\sqrt{2\pi a\sigma}} \exp\left\{-\left(x - b - a\mu\right)^2 / 2(a\sigma)^2\right\} \end{aligned} fY(x)=a1fX(axb)=2πaσ1exp{(axbμ)2/2σ2}=2πaσ1exp{(xbaμ)2/2()2}

  • 这表明 Y∼N(aμ+b,a2σ2)Y \sim N(a\mu + b, a^2\sigma^2)YN(aμ+b,a2σ2)

标准正态分布

如果 X∼N(μ,σ2)X \sim N(\mu, \sigma^2)XN(μ,σ2),则 Z=(X−μ)/σ∼N(0,1)Z = (X - \mu)/\sigma \sim N(0, 1)Z=(Xμ)/σN(0,1)

  • 标准正态分布的密度函数为:
    fZ(z)=12πe−z2/2 f_Z(z) = \frac{1}{\sqrt{2\pi}} e^{-z^2/2} fZ(z)=2π1ez2/2

  • 分布函数记为 Φ(z)\Phi(z)Φ(z)
    Φ(z)=12π∫−∞ze−y2/2 dy \Phi(z) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{z} e^{-y^2/2} \, \mathrm{d}y Φ(z)=2π1zey2/2dy

  • 对称性:Φ(−z)=1−Φ(z)\Phi(-z) = 1 - \Phi(z)Φ(z)=1Φ(z)

期望与方差

例 4a:设 XXX 是参数为 μ\muμσ2\sigma^2σ2 的正态随机变量,求 E[X]E[X]E[X]Var(X)Var(X)Var(X)

  • 先计算标准正态变量 ZZZ 的期望:
    E[Z]=12π∫−∞∞ze−z2/2 dz=0 E[Z] = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} z e^{-z^2/2} \, \mathrm{d}z = 0 E[Z]=2π1zez2/2dz=0
    (奇函数在对称区间上的积分)

  • 计算 Var(Z)=E[Z2]Var(Z) = E[Z^2]Var(Z)=E[Z2]
    Var(Z)=12π∫−∞∞z2e−z2/2 dz=12π[−ze−z2/2∣−∞∞+∫−∞∞e−z2/2 dz]=12π∫−∞∞e−z2/2 dz=1 \begin{aligned} Var(Z) &= \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} z^2 e^{-z^2/2} \, \mathrm{d}z \\ &= \frac{1}{\sqrt{2\pi}} \left[ -z e^{-z^2/2} \Big|_{-\infty}^{\infty} + \int_{-\infty}^{\infty} e^{-z^2/2} \, \mathrm{d}z \right] \\ &= \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} e^{-z^2/2} \, \mathrm{d}z = 1 \end{aligned} Var(Z)=2π1z2ez2/2dz=2π1[zez2/2+ez2/2dz]=2π1ez2/2dz=1

  • 由于 X=μ+σZX = \mu + \sigma ZX=μ+σZ
    E[X]=μ+σE[Z]=μVar(X)=σ2Var(Z)=σ2 \begin{aligned} E[X] &= \mu + \sigma E[Z] = \mu \\ Var(X) &= \sigma^2 Var(Z) = \sigma^2 \end{aligned} E[X]Var(X)=μ+σE[Z]=μ=σ2Var(Z)=σ2

[!IMPORTANT]

标准正态分布方差的详细计算

步骤 1:设置积分
Var(Z)=12π∫−∞∞z2e−z2/2 dz Var(Z) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} z^2 e^{-z^2/2} \, dz Var(Z)=2π1z2ez2/2dz

步骤 2:应用分部积分法

我们需要计算 ∫−∞∞z2e−z2/2 dz\int_{-\infty}^{\infty} z^2 e^{-z^2/2} \, dzz2ez2/2dz,使用分部积分法

回忆分部积分公式:
∫u dv=uv−∫v du \int u \, dv = uv - \int v \, du udv=uvvdu

选择:

  • u=zu = zu=z,则 du=dzdu = dzdu=dz
  • dv=ze−z2/2 dzdv = z e^{-z^2/2} \, dzdv=zez2/2dz,则 v=−e−z2/2v = -e^{-z^2/2}v=ez2/2(因为 ddz(−e−z2/2)=ze−z2/2\frac{d}{dz}(-e^{-z^2/2}) = z e^{-z^2/2}dzd(ez2/2)=zez2/2

应用公式:
∫z2e−z2/2 dz=∫u dv=uv−∫v du=z⋅(−e−z2/2)−∫(−e−z2/2) dz=−ze−z2/2+∫e−z2/2 dz \begin{aligned} \int z^2 e^{-z^2/2} \, dz &= \int u \, dv \\ &= uv - \int v \, du \\ &= z \cdot (-e^{-z^2/2}) - \int (-e^{-z^2/2}) \, dz \\ &= -z e^{-z^2/2} + \int e^{-z^2/2} \, dz \end{aligned} z2ez2/2dz=udv=uvvdu=z(ez2/2)(ez2/2)dz=zez2/2+ez2/2dz

步骤 3:计算定积分

将上述结果应用于定积分:
∫−∞∞z2e−z2/2 dz=[−ze−z2/2]−∞∞+∫−∞∞e−z2/2 dz \int_{-\infty}^{\infty} z^2 e^{-z^2/2} \, dz = \left[ -z e^{-z^2/2} \right]_{-\infty}^{\infty} + \int_{-\infty}^{\infty} e^{-z^2/2} \, dz z2ez2/2dz=[zez2/2]+ez2/2dz

分析边界项 [−ze−z2/2]−∞∞\left[ -z e^{-z^2/2} \right]_{-\infty}^{\infty}[zez2/2]

  • z→∞z \to \inftyz 时:
    lim⁡z→∞(−ze−z2/2)=lim⁡z→∞−zez2/2 \lim_{z \to \infty} (-z e^{-z^2/2}) = \lim_{z \to \infty} \frac{-z}{e^{z^2/2}} zlim(zez2/2)=zlimez2/2z
    这是一个 ∞∞\frac{\infty}{\infty} 型不定式,应用洛必达法则:
    lim⁡z→∞−zez2/2=lim⁡z→∞−1zez2/2=0 \lim_{z \to \infty} \frac{-z}{e^{z^2/2}} = \lim_{z \to \infty} \frac{-1}{z e^{z^2/2}} = 0 zlimez2/2z=zlimzez2/21=0
    (分子是常数,分母趋向无穷大)

  • z→−∞z \to -\inftyz 时:
    lim⁡z→−∞(−ze−z2/2)=lim⁡z→−∞−zez2/2 \lim_{z \to -\infty} (-z e^{-z^2/2}) = \lim_{z \to -\infty} \frac{-z}{e^{z^2/2}} zlim(zez2/2)=zlimez2/2z
    w=−zw = -zw=z,则 w→∞w \to \inftyw
    lim⁡w→∞wew2/2=0 \lim_{w \to \infty} \frac{w}{e^{w^2/2}} = 0 wlimew2/2w=0
    (同样应用洛必达法则)

因此:
[−ze−z2/2]−∞∞=0−0=0 \left[ -z e^{-z^2/2} \right]_{-\infty}^{\infty} = 0 - 0 = 0 [zez2/2]=00=0

步骤 4:简化表达式

代入边界项的结果:
∫−∞∞z2e−z2/2 dz=0+∫−∞∞e−z2/2 dz=∫−∞∞e−z2/2 dz \int_{-\infty}^{\infty} z^2 e^{-z^2/2} \, dz = 0 + \int_{-\infty}^{\infty} e^{-z^2/2} \, dz = \int_{-\infty}^{\infty} e^{-z^2/2} \, dz z2ez2/2dz=0+ez2/2dz=ez2/2dz

步骤 5:应用高斯积分结果

从之前的讨论(极坐标变换)我们知道:
∫−∞∞e−z2/2 dz=2π \int_{-\infty}^{\infty} e^{-z^2/2} \, dz = \sqrt{2\pi} ez2/2dz=2π

将结果代入方差公式:
Var(Z)=12π∫−∞∞z2e−z2/2 dz=12π∫−∞∞e−z2/2 dz=12π⋅2π=1 \begin{aligned} Var(Z) &= \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} z^2 e^{-z^2/2} \, dz \\ &= \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} e^{-z^2/2} \, dz \\ &= \frac{1}{\sqrt{2\pi}} \cdot \sqrt{2\pi} \\ &= 1 \end{aligned} Var(Z)=2π1z2ez2/2dz=2π1ez2/2dz=2π12π=1

例题

例 4b:如果 XXX 服从正态分布,参数为 μ=3\mu=3μ=3σ2=9\sigma^2 = 9σ2=9(即 σ=3\sigma = 3σ=3),求:

  • (a) P{2≤X≤5}P\{2 \leq X \leq 5\}P{2X5}
    P{2<X<5}=P{2−33<X−33<5−33}=P{−13<Z<23}=Φ(23)−Φ(−13)=Φ(23)−[1−Φ(13)]≈0.7486−(1−0.6293)=0.3779 \begin{aligned} P\{2 < X < 5\} &= P\left\{\frac{2-3}{3} < \frac{X-3}{3} < \frac{5-3}{3}\right\} \\ &= P\left\{-\frac{1}{3} < Z < \frac{2}{3}\right\} \\ &= \Phi\left(\frac{2}{3}\right) - \Phi\left(-\frac{1}{3}\right) \\ &= \Phi\left(\frac{2}{3}\right) - \left[1 - \Phi\left(\frac{1}{3}\right)\right] \\ &\approx 0.7486 - (1 - 0.6293) = 0.3779 \end{aligned} P{2<X<5}=P{323<3X3<353}=P{31<Z<32}=Φ(32)Φ(31)=Φ(32)[1Φ(31)]0.7486(10.6293)=0.3779

  • (b) P{X>0}P\{X > 0\}P{X>0}
    P{X>0}=P{X−33>0−33}=P{Z>−1}=1−Φ(−1)=Φ(1)≈0.8413 \begin{aligned} P\{X > 0\} &= P\left\{\frac{X-3}{3} > \frac{0-3}{3}\right\} \\ &= P\{Z > -1\} \\ &= 1 - \Phi(-1) \\ &= \Phi(1) \approx 0.8413 \end{aligned} P{X>0}=P{3X3>303}=P{Z>1}=1Φ(1)=Φ(1)0.8413

  • © P{∣X−3∣>6}P\{|X-3| > 6\}P{X3∣>6}
    P{∣X−3∣>6}=P{X>9}+P{X<−3}=P{Z>2}+P{Z<−2}=[1−Φ(2)]+Φ(−2)=2[1−Φ(2)]≈2(1−0.9772)=0.0456 \begin{aligned} P\{|X-3| > 6\} &= P\{X > 9\} + P\{X < -3\} \\ &= P\{Z > 2\} + P\{Z < -2\} \\ &= [1 - \Phi(2)] + \Phi(-2) \\ &= 2[1 - \Phi(2)] \approx 2(1 - 0.9772) = 0.0456 \end{aligned} P{X3∣>6}=P{X>9}+P{X<3}=P{Z>2}+P{Z<2}=[1Φ(2)]+Φ(2)=2[1Φ(2)]2(10.9772)=0.0456


例 4c:考试分数的等级划分

如果考试分数服从正态分布 N(μ,σ2)N(\mu, \sigma^2)N(μ,σ2),则:

  • A等(超过 μ+σ\mu+\sigmaμ+σ):P{X>μ+σ}=1−Φ(1)≈0.1587P\{X > \mu + \sigma\} = 1 - \Phi(1) \approx 0.1587P{X>μ+σ}=1Φ(1)0.1587
  • B等(μ\muμμ+σ\mu+\sigmaμ+σ):P{μ<X<μ+σ}=Φ(1)−Φ(0)≈0.3413P\{\mu < X < \mu + \sigma\} = \Phi(1) - \Phi(0) \approx 0.3413P{μ<X<μ+σ}=Φ(1)Φ(0)0.3413
  • C等(μ−σ\mu-\sigmaμσμ\muμ):P{μ−σ<X<μ}=Φ(0)−Φ(−1)≈0.3413P\{\mu - \sigma < X < \mu\} = \Phi(0) - \Phi(-1) \approx 0.3413P{μσ<X<μ}=Φ(0)Φ(1)0.3413
  • D等(μ−2σ\mu-2\sigmaμ2σμ−σ\mu-\sigmaμσ):P{μ−2σ<X<μ−σ}=Φ(1)−Φ(2)≈0.1359P\{\mu - 2\sigma < X < \mu - \sigma\} = \Phi(1) - \Phi(2) \approx 0.1359P{μ2σ<X<μσ}=Φ(1)Φ(2)0.1359
  • E等(低于 μ−2σ\mu-2\sigmaμ2σ):P{X<μ−2σ}=Φ(−2)≈0.0228P\{X < \mu - 2\sigma\} = \Phi(-2) \approx 0.0228P{X<μ2σ}=Φ(2)0.0228

因此,近似地:

  • A等:16%
  • B等:34%
  • C等:34%
  • D等:14%
  • E等:2%

例 4d:怀孕期问题

母亲的怀孕期 X∼N(270,100)X \sim N(270, 100)XN(270,100)(即 μ=270\mu = 270μ=270σ=10\sigma = 10σ=10)。

如果被告是孩子的父亲,母亲在被告出国前或回国后怀孕的概率:
P{X>290 或 X<240}=P{X>290}+P{X<240}=P{X−27010>2}+P{X−27010<−3}=[1−Φ(2)]+Φ(−3)≈(1−0.9772)+0.0013=0.0241 \begin{aligned} P\{X > 290 \text{ 或 } X < 240\} &= P\{X > 290\} + P\{X < 240\} \\ &= P\left\{\frac{X-270}{10} > 2\right\} + P\left\{\frac{X-270}{10} < -3\right\} \\ &= [1 - \Phi(2)] + \Phi(-3) \\ &\approx (1 - 0.9772) + 0.0013 = 0.0241 \end{aligned} P{X>290  X<240}=P{X>290}+P{X<240}=P{10X270>2}+P{10X270<3}=[1Φ(2)]+Φ(3)(10.9772)+0.0013=0.0241


例 4e:电信信号传输

当传送信息为 1 时发送值 2,为 0 时发送值 -2。接收值 R=x+NR = x + NR=x+N,其中 N∼N(0,1)N \sim N(0,1)NN(0,1)

  • 信息 1 被错误认为 0 的概率(当 R<0.5R < 0.5R<0.5):
    P{2+N<0.5}=P{N<−1.5}=1−Φ(1.5)≈0.0668 P\{2 + N < 0.5\} = P\{N < -1.5\} = 1 - \Phi(1.5) \approx 0.0668 P{2+N<0.5}=P{N<1.5}=1Φ(1.5)0.0668

  • 信息 0 被错误认为 1 的概率(当 R≥0.5R \geq 0.5R0.5):
    P{−2+N≥0.5}=P{N≥2.5}=1−Φ(2.5)≈0.0062 P\{-2 + N \geq 0.5\} = P\{N \geq 2.5\} = 1 - \Phi(2.5) \approx 0.0062 P{2+N0.5}=P{N2.5}=1Φ(2.5)0.0062


正态近似

棣莫弗-拉普拉斯极限定理

nnn 次独立重复试验中,设每次成功的概率为 ppp,记成功总次数为 SnS_nSn,则对任意 a<ba < ba<b

P{a⩽Sn−npnp(1−p)⩽b}→Φ(b)−Φ(a)当 n→∞ P\left\{a \leqslant \frac{S_n - np}{\sqrt{np(1-p)}} \leqslant b\right\} \to \Phi(b) - \Phi(a) \quad \text{当 } n \to \infty P{anp(1p)Snnpb}Φ(b)Φ(a) n

使用条件

  • np(1−p)≥10np(1-p) \geq 10np(1p)10 时,正态近似效果很好
  • 需要进行连续性修正(因为二项分布是离散的,而正态分布是连续的)

连续性修正

  • P{Sn=i}≈P{i−0.5<X<i+0.5}P\{S_n = i\} \approx P\{i-0.5 < X < i+0.5\}P{Sn=i}P{i0.5<X<i+0.5},其中 XXX 为正态变量

例 4g:抛 40 次均匀硬币

XXX 为正面次数,X∼Binomial(40,0.5)X \sim \text{Binomial}(40, 0.5)XBinomial(40,0.5)

  • 正态近似:
    P{X=20}=P{19.5<X<20.5}=P{19.5−2010<X−2010<20.5−2010}≈P{−0.16<Z<0.16}=Φ(0.16)−Φ(−0.16)≈0.1272 \begin{aligned} P\{X = 20\} &= P\{19.5 < X < 20.5\} \\ &= P\left\{\frac{19.5 - 20}{\sqrt{10}} < \frac{X - 20}{\sqrt{10}} < \frac{20.5 - 20}{\sqrt{10}}\right\} \\ &\approx P\{-0.16 < Z < 0.16\} \\ &= \Phi(0.16) - \Phi(-0.16) \approx 0.1272 \end{aligned} P{X=20}=P{19.5<X<20.5}=P{1019.520<10X20<1020.520}P{0.16<Z<0.16}=Φ(0.16)Φ(0.16)0.1272

  • 精确解:
    P{X=20}=(4020)(12)40≈0.1254 P\{X = 20\} = \binom{40}{20} \left(\frac{1}{2}\right)^{40} \approx 0.1254 P{X=20}=(2040)(21)400.1254


例 4h:学院招生问题

XXX 为入学新生人数,X∼Binomial(450,0.3)X \sim \text{Binomial}(450, 0.3)XBinomial(450,0.3)

  • 正态近似:
    P{X≥150}≈P{X≥150.5}=P{X−450×0.3450×0.3×0.7≥150.5−13594.5}=P{Z≥15.59.72}=P{Z≥1.59}≈1−Φ(1.59)≈0.0559 \begin{aligned} P\{X \geq 150\} &\approx P\{X \geq 150.5\} \\ &= P\left\{\frac{X - 450 \times 0.3}{\sqrt{450 \times 0.3 \times 0.7}} \geq \frac{150.5 - 135}{\sqrt{94.5}}\right\} \\ &= P\left\{Z \geq \frac{15.5}{9.72}\right\} \\ &= P\{Z \geq 1.59\} \\ &\approx 1 - \Phi(1.59) \approx 0.0559 \end{aligned} P{X150}P{X150.5}=P{450×0.3×0.7X450×0.394.5150.5135}=P{Z9.7215.5}=P{Z1.59}1Φ(1.59)0.0559

因此,入学新生超过 150 名的概率约为 5.59%。


例 4i:胆固醇试验

XXX 为胆固醇降低的人数,X∼Binomial(100,0.5)X \sim \text{Binomial}(100, 0.5)XBinomial(100,0.5)(假设食品无效)。

  • 正态近似:
    P{X≥65}≈P{X≥64.5}=P{X−505≥64.5−505}=P{Z≥2.9}≈1−Φ(2.9)≈0.0019 \begin{aligned} P\{X \geq 65\} &\approx P\{X \geq 64.5\} \\ &= P\left\{\frac{X - 50}{5} \geq \frac{64.5 - 50}{5}\right\} \\ &= P\{Z \geq 2.9\} \\ &\approx 1 - \Phi(2.9) \approx 0.0019 \end{aligned} P{X65}P{X64.5}=P{5X50564.550}=P{Z2.9}1Φ(2.9)0.0019

因此,即使食品无效,营养学家仍承认它有效的概率约为 0.19%。


例 4j:纽约市民支持率

SnS_nSn 为支持禁令的人数,Sn∼Binomial(n,0.52)S_n \sim \text{Binomial}(n, 0.52)SnBinomial(n,0.52)

  • 正态近似:
    P{Sn>0.5n}=P{Sn−0.52nn×0.52×0.48>0.5n−0.52nn×0.52×0.48}=P{Z>−0.04n}=Φ(0.04n) \begin{aligned} P\{S_n > 0.5n\} &= P\left\{\frac{S_n - 0.52n}{\sqrt{n \times 0.52 \times 0.48}} > \frac{0.5n - 0.52n}{\sqrt{n \times 0.52 \times 0.48}}\right\} \\ &= P\left\{Z > -0.04\sqrt{n}\right\} \\ &= \Phi(0.04\sqrt{n}) \end{aligned} P{Sn>0.5n}=P{n×0.52×0.48Sn0.52n>n×0.52×0.480.5n0.52n}=P{Z>0.04n}=Φ(0.04n)

  • 计算:

    • n=11n = 11n=11Φ(0.1328)≈0.5528\Phi(0.1328) \approx 0.5528Φ(0.1328)0.5528
    • n=101n = 101n=101Φ(0.4020)≈0.6562\Phi(0.4020) \approx 0.6562Φ(0.4020)0.6562
    • n=1001n = 1001n=1001Φ(1.2665)≈0.8973\Phi(1.2665) \approx 0.8973Φ(1.2665)0.8973
  • 为使概率 > 0.95:
    Φ(0.04n)>0.95⇒0.04n>1.645⇒n≥1692 \Phi(0.04\sqrt{n}) > 0.95 \Rightarrow 0.04\sqrt{n} > 1.645 \Rightarrow n \geq 1692 Φ(0.04n)>0.950.04n>1.645n1692


本节小结

特性公式
密度函数f(x)={1β−αα<x<β0其他f(x) = \begin{cases} \frac{1}{\beta-\alpha} & \alpha < x < \beta \\ 0 & \text{其他} \end{cases}f(x)={βα10α<x<β其他
分布函数F(a)={0a≤αa−αβ−αα<a<β1a≥βF(a) = \begin{cases} 0 & a \leq \alpha \\ \frac{a-\alpha}{\beta-\alpha} & \alpha < a < \beta \\ 1 & a \geq \beta \end{cases}F(a)=0βαaα1aαα<a<βaβ
期望E[X]=α+β2E[X] = \frac{\alpha + \beta}{2}E[X]=2α+β
方差Var(X)=(β−α)212Var(X) = \frac{(\beta - \alpha)^2}{12}Var(X)=12(βα)2

正态随机变量

特性公式
密度函数f(x)=12πσe−(x−μ)2/2σ2f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-(x-\mu)^2/2\sigma^2}f(x)=2πσ1e(xμ)2/2σ2
标准正态分布Z=X−μσ∼N(0,1)Z = \frac{X-\mu}{\sigma} \sim N(0,1)Z=σXμN(0,1)
分布函数Φ(z)=12π∫−∞ze−y2/2 dy\Phi(z) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{z} e^{-y^2/2} \, \mathrm{d}yΦ(z)=2π1zey2/2dy
对称性Φ(−z)=1−Φ(z)\Phi(-z) = 1 - \Phi(z)Φ(z)=1Φ(z)
期望E[X]=μE[X] = \muE[X]=μ
方差Var(X)=σ2Var(X) = \sigma^2Var(X)=σ2
线性变换aX+b∼N(aμ+b,a2σ2)aX + b \sim N(a\mu + b, a^2\sigma^2)aX+bN(aμ+b,a2σ2)

二项分布的正态近似

  • 条件np(1−p)≥10np(1-p) \geq 10np(1p)10
  • 连续性修正P{Sn=i}≈P{i−0.5<X<i+0.5}P\{S_n = i\} \approx P\{i-0.5 < X < i+0.5\}P{Sn=i}P{i0.5<X<i+0.5}
  • 标准化Sn−npnp(1−p)≈N(0,1)\frac{S_n - np}{\sqrt{np(1-p)}} \approx N(0,1)np(1p)SnnpN(0,1)概率论基础教程第5章 连续型随机变量(一)
http://www.dtcms.com/a/339379.html

相关文章:

  • 字节开源了一款具备长期记忆能力的多模态智能体:M3-Agent
  • RabbitMQ:SpringBoot+RabbitMQ Direct Exchange(直连型交换机)
  • 第7章 React性能优化核心
  • [langgraph]创建第一个agent
  • 如何在 Git Commit Message 中正确提及共同贡献者(Co-authored-by 实践指南)
  • 图解快速排序C语言实现
  • 数据结构----八大排序算法
  • 【报文构造】构造一个异常的IPV6报文,测试设备可靠性
  • 集成电路学习:什么是Object Tracking目标跟踪
  • 浙江电信IPTV天邑TY1613_高安版_晶晨S905L3SB_安卓9_原厂固件自改_线刷包
  • Arthas 全面使用指南:离线安装 + Docker/K8s 集成 + 集中管理
  • WRC大会精彩回顾 | NanoLoong机器人足球首秀青龙机械臂咖啡服务双线出击
  • 释永信,领先10年的AI心法!
  • sqllabs(2)
  • 机器学习之数据模型训练(三)
  • 嵌入式第三十二天(信号,共享内存)
  • 装修水电全改的避坑指南有哪些?
  • [激光原理与应用-304]:光学设计 - 光学设计报告的主要内容、格式与示例:系统记录了从需求分析到最终设计的完整过程
  • windows环境,安装kafka
  • PMP项目管理:PMBOK 第六版 与 第七版 有啥区别 / 如何备考
  • Spring Boot应用实现图片资源服务
  • WSL2环境下的Claude Code与lanyuncodingui安装与配置
  • 差速转向机器人研发:创新驱动的未来移动技术探索
  • 子网掩码(拓)
  • 汇编语言学习2---GNU Debugger (GDB)
  • bypass webshell--Trait
  • canopen 初体验
  • 【qml-4】qml与c++交互(类型多例)
  • 配置nginx以支持http3
  • rabbitmq发送的延迟消息时间过长就立即消费了