正态分布习题集 · 题目篇
正态分布习题集 · 题目篇
全面覆盖单变量正态、多变量正态、参数估计、假设检验、变换以及应用,共 20 题,从基础到进阶。完成后请移步《答案与解析篇》。
1. 基础定义与性质(5题)
1.1 密度函数
写出正态分布 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2) 的概率密度函数(PDF),解释参数含义。
1.2 标准正态变换
给定 X ∼ N ( μ , σ 2 ) X \sim N(\mu,\sigma^2) X∼N(μ,σ2),写出将 X X X 标准化为 Z ∼ N ( 0 , 1 ) Z \sim N(0,1) Z∼N(0,1) 的变换公式,并证明 Z Z Z 确实服从标准正态分布。
1.3 主要性质
填表给出正态分布 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2) 的 (1) 期望值 (2) 方差 (3) 偏度 (4) 峰度 (5) 熵。
1.4 正态和
证明:若 X 1 ∼ N ( μ 1 , σ 1 2 ) X_1 \sim N(\mu_1,\sigma_1^2) X1∼N(μ1,σ12) 且 X 2 ∼ N ( μ 2 , σ 2 2 ) X_2 \sim N(\mu_2,\sigma_2^2) X2∼N(μ2,σ22) 相互独立,则 X 1 + X 2 ∼ N ( μ 1 + μ 2 , σ 1 2 + σ 2 2 ) X_1 + X_2 \sim N(\mu_1+\mu_2, \sigma_1^2+\sigma_2^2) X1+X2∼N(μ1+μ2,σ12+σ22)。
1.5 边缘正态
若 ( X , Y ) (X,Y) (X,Y) 服从二维正态分布,证明其边缘分布 X X X 和 Y Y Y 也是正态的。
2. 理论推导与关键结果(5题)
2.1 矩生成函数
推导正态分布 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2) 的矩生成函数(MGF),并由此计算前四阶矩。
2.2 最大熵原理
证明:在所有均值为 μ \mu μ、方差为 σ 2 \sigma^2 σ2 的连续分布中,正态分布 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2) 具有最大熵。
2.3 Q函数与误差函数
建立标准正态 CDF 与误差函数 erf ( x ) \text{erf}(x) erf(x) 的关系,并计算 P ( X > 1.5 ) P(X > 1.5) P(X>1.5) 其中 X ∼ N ( 0 , 1 ) X \sim N(0,1) X∼N(0,1)。
2.4 切比雪夫不等式对比
对于 X ∼ N ( 0 , 1 ) X \sim N(0,1) X∼N(0,1),计算:
a) 切比雪夫不等式给出的 P ( ∣ X ∣ > 2 ) P(|X| > 2) P(∣X∣>2) 上界;
b) 真实概率 P ( ∣ X ∣ > 2 ) P(|X| > 2) P(∣X∣>2)。
2.5 条件分布
设 ( X , Y ) (X,Y) (X,Y) 服从二维正态分布,相关系数为 ρ \rho ρ。求 Y ∣ X = x Y|X=x Y∣X=x 的条件分布。
3. 参数估计与信赖区间(4题)
3.1 估计器比较
样本 X 1 , X 2 , … , X n ∼ i . i . d . N ( μ , σ 2 ) X_1,X_2,\ldots,X_n \stackrel{i.i.d.}{\sim} N(\mu,\sigma^2) X1,X2,…,Xn∼i.i.d.N(μ,σ2),比较以下 σ 2 \sigma^2 σ2 估计器的表现:
a) σ ^ 1 2 = 1 n ∑ i = 1 n ( X i − X ˉ ) 2 \hat{\sigma}^2_1 = \frac{1}{n}\sum_{i=1}^{n}(X_i-\bar{X})^2 σ^12=n1∑i=1n(Xi−Xˉ)2;
b) σ ^ 2 2 = 1 n − 1 ∑ i = 1 n ( X i − X ˉ ) 2 \hat{\sigma}^2_2 = \frac{1}{n-1}\sum_{i=1}^{n}(X_i-\bar{X})^2 σ^22=n−11∑i=1n(Xi−Xˉ)2。
3.2 充分统计量
证明:对于正态总体, ( X ˉ , S 2 ) (\bar{X}, S^2) (Xˉ,S2) 是 ( μ , σ 2 ) (\mu, \sigma^2) (μ,σ2) 的充分统计量。
3.3 区间估计
样本 X 1 , X 2 , … , X n ∼ i . i . d . N ( μ , σ 2 ) X_1,X_2,\ldots,X_n \stackrel{i.i.d.}{\sim} N(\mu,\sigma^2) X1,X2,…,Xn∼i.i.d.N(μ,σ2), σ 2 \sigma^2 σ2 已知。
a) 导出 μ \mu μ 的 1 − α 1-\alpha 1−α 置信区间;
b) 若 σ 2 \sigma^2 σ2 未知, μ \mu μ 的置信区间如何变化?
3.4 Bayesian 估计
设先验 μ ∼ N ( μ 0 , τ 2 ) \mu \sim N(\mu_0, \tau^2) μ∼N(μ0,τ2), σ 2 \sigma^2 σ2 已知,观测 X 1 , … , X n ∼ N ( μ , σ 2 ) X_1,\ldots,X_n \sim N(\mu,\sigma^2) X1,…,Xn∼N(μ,σ2),求 μ \mu μ 的后验分布。
4. 多变量正态与变换(3题)
4.1 二维正态型态
写出二维正态分布 ( X , Y ) (X,Y) (X,Y) 的 PDF,并解释协方差矩阵中各参数对等高线形状的影响。
4.2 线性变换
设 X ∼ N ( μ , Σ ) \mathbf{X} \sim N(\boldsymbol{\mu}, \boldsymbol{\Sigma}) X∼N(μ,Σ) 为 k k k 维正态向量, A \mathbf{A} A 为 m × k m \times k m×k 矩阵。证明 Y = A X \mathbf{Y = AX} Y=AX 服从 m m m 维正态分布,并给出其均值向量和协方差矩阵。
4.3 独立性与相关性
对多元正态分布,证明:分量间的不相关性与独立性等价。
5. 应用与检验(3题)
5.1 假设检验功效
某检验判断样本均值是否不等于 100: H 0 : μ = 100 H_0: \mu = 100 H0:μ=100 vs H 1 : μ ≠ 100 H_1: \mu \neq 100 H1:μ=100。总体标准差为 15,样本量 n = 25 n=25 n=25,显著性水平 α = 0.05 \alpha = 0.05 α=0.05。若真实均值为 μ = 105 \mu = 105 μ=105,计算此检验的功效(power)。
5.2 正态性检验
简述 3 种检验数据是否服从正态分布的方法,并说明各自适用场景。
5.3 抗体检测
实验室测量了 9 名患者的抗体水平(单位:µg/mL):22.3, 24.8, 19.7, 23.2, 20.5, 24.1, 21.3, 22.9, 23.8。
假设数据服从正态分布:
a) 构造抗体水平均值的 95% 置信区间;
b) 检验抗体均值是否大于 20 µg/mL(单侧 α = 0.05 \alpha=0.05 α=0.05)。
做完全部题目后,请移步《答案与解析篇》核对!