当前位置: 首页 > news >正文

概率论与数理统计(八)

参数估计

通过取样本,并用样本构造函数,达成估计分布函数参数的目的

矩估计法

本质:用样本的各阶矩代替总体的各阶矩,即取:

E(X)=X‾=1n∑iXiE(X2)=1n∑iXi2E(X)=\overline{X}=\dfrac{1}{n}\sum_i X_i\\ E(X^2)=\dfrac{1}{n}\sum_iX_i^2 E(X)=X=n1iXiE(X2)=n1iXi2

极大似然估计法

本质:将使得样本 AAA 发生概率最大的参数值作为估计值

1、写出总体概率/密度函数

2、构造似然函数 L(λ)L(\lambda)L(λ)

3、两边取 ln⁡\lnln

4、对 λ\lambdaλ 求导

点估计的优良性准则

一、无偏性E(θ^)=θE(\hat{\theta})=\thetaE(θ^)=θ

定理:总体为 XXX,且 E(X)=μE(X)=\muE(X)=μD(X)=σ2D(X)=\sigma^2D(X)=σ2,样本为 (X1,⋯,Xn)(X_1,\cdots,X_n)(X1,,Xn),那么有:

1、X‾\overline{X}Xμ\muμ 的无偏估计

2、样本方差 S2S^2S2σ2\sigma^2σ2 的无偏估计

3、取 μ^=C1X1+⋯+CnXn\hat{\mu}=C_1X_1 + \cdots + C_nX_nμ^=C1X1++CnXn,若 C1+⋯+Cn=1C_1+\cdots + C_n=1C1++Cn=1,则 μ^\hat{\mu}μ^μ\muμ 的无偏估计

证明:

1 与 2:

已经在 上一份笔记 中证明过 E(X‾)=μE(\overline{X})=\muE(X)=μE(S2)=σ2E(S^2)=\sigma^2E(S2)=σ2

3:

E(μ^)=E(C1X1+⋯+CnXn)=E(C1X1)+⋯+E(CnXn)=C1E(X1)+⋯+CnE(Xn)=(C1+⋯+Cn)μ=μ\begin{align*} E(\hat{\mu}) &= E(C_1X_1 + \cdots + C_nX_n)\\ &=E(C_1X_1)+\cdots+E(C_nX_n)\\ &=C_1E(X_1)+\cdots+C_nE(X_n)\\ &=(C_1+\cdots+C_n)\mu\\ &=\mu \end{align*} E(μ^)=E(C1X1++CnXn)=E(C1X1)++E(CnXn)=C1E(X1)++CnE(Xn)=(C1++Cn)μ=μ

!注意:θ^\hat{\theta}θ^θ\thetaθ 的无偏估计,但是 g(θ^)g(\hat{\theta})g(θ^) 不一定是 g(θ)g(\theta)g(θ) 的无偏估计
例如:S2S^2S2σ2\sigma^2σ2 的无偏估计,而 SSS 不是 σ\sigmaσ 的无偏估计(性质)
该性质的证明:
D(S)=E(S2)−E(S)2=σ2−E(S)2⇒E(S)=σ2−D(S)⩽σ\begin{align*} &D(S) = E(S^2)-E(S)^2\\ &=\sigma^2-E(S)^2\\ &\Rightarrow E(S)=\sqrt{\sigma^2-D(S)}\leqslant\sigma \end{align*} D(S)=E(S2)E(S)2=σ2E(S)2E(S)=σ2D(S)σ

二、有效性D(θ1^)⩽D(θ2^)D(\hat{\theta_1})\leqslant D(\hat{\theta_2})D(θ1^)D(θ2^)

定理:总体为 XXX,且 E(X)=μE(X)=\muE(X)=μD(X)=σ2D(X)=\sigma^2D(X)=σ2,样本为 (X1,⋯,Xn)(X_1,\cdots,X_n)(X1,,Xn),若 a1+⋯+an=1a_1+\cdots+a_n=1a1++an=1,则现有两种 μ\muμ 的估计:a1X1+⋯+anXna_1X_1+\cdots+a_nX_na1X1++anXnX‾\overline{X}X,由有效性准则认为,X‾\overline{X}X 更优

证明:

由 上一份笔记 知 D(X‾)=σ2nD(\overline{X})=\dfrac{\sigma^2}{n}D(X)=nσ2

那么有:

D(θ^)=D(a1X1+⋯+anXn)=a12D(X1)+⋯+an2D(Xn)=σ2(a12+⋯+an2)⩾σ2n\begin{align*} D(\hat{\theta})&=D(a_1X_1+\cdots+a_nX_n)\\ &=a_1^2D(X_1)+\cdots+a_n^2D(X_n)\\ &=\sigma^2(a^2_1+\cdots+a^2_n)\\ &\geqslant \dfrac{\sigma^2}{n} \end{align*} D(θ^)=D(a1X1++anXn)=a12D(X1)++an2D(Xn)=σ2(a12++an2)nσ2

三、相合性(一致性)lim⁡n→+∞P(∣θ^−θ∣<ε)=1\lim\limits_{n\to +\infty}P(|\hat{\theta}-\theta|<\varepsilon)=1n+limP(θ^θ<ε)=1

置信区间

区间估计时,区间长度落在区间的概率 十分重要

P(θ1⩽θ⩽θ2)=1−αP(\theta_1 \leqslant \theta \leqslant \theta_2)=1-\alphaP(θ1θθ2)=1α,则 1−α1-\alpha1α 称为 置信度,而 [θ1,θ2][\theta_1,\theta_2][θ1,θ2] 则是估计区间

定义:

1、I=I(T,θ)I=I(T,\theta)I=I(T,θ),其中 θ\thetaθ 是未知参数,TTT 是已知的,随机变量 III 的分布 FFF 已知且其分布与 θ\thetaθ 无关,则将 III 称为 枢轴变量

2、给定 1−α1-\alpha1α,确定 FFF 的上 α2\dfrac{\alpha}{2}2α 分位数为 vα2v_{\frac{\alpha}{2}}v2α,上 1−α21-\dfrac{\alpha}{2}12αv1−α2v_{1-\frac{\alpha}{2}}v12α,则:

P(vα2⩽I(T,θ)⩽v1−α2)=1−αP\left(v_{\frac{\alpha}{2}}\leqslant I(T,\theta) \leqslant v_{1-\frac{\alpha}{2}}\right)=1-\alpha P(v2αI(T,θ)v12α)=1α

一个正态总体的均值和方差的区间估计

v=n(X‾−μ)σ∼N(0,1)v=\dfrac{\sqrt{n}(\overline{X}-\mu)}{\sigma}\sim N(0,1)v=σn(Xμ)N(0,1)

给定 1−α1-\alpha1α,令 P(v>uα2)=α2P(v>u_{\frac{\alpha}{2}})=\dfrac{\alpha}{2}P(v>u2α)=2α

1、σ2\sigma^2σ2 已知,对 μ\muμ 的区间估计:

P(−uα2⩽n(X‾−μ)σ⩽uα2)=1−αP(−σuα2n⩽X‾−μ⩽σuα2n)=1−αP(X‾−σuα2n⩽μ⩽X‾+σuα2n)=1−α\begin{align*} &P\left(-u_{\frac{\alpha}{2}}\leqslant \dfrac{\sqrt{n}(\overline{X}-\mu)}{\sigma} \leqslant u_{\frac{\alpha}{2}}\right)=1-\alpha\\ &P\left(-\dfrac{\sigma u_{\frac{\alpha}{2}}}{\sqrt{n}}\leqslant\overline{X}-\mu\leqslant\dfrac{\sigma u_{\frac{\alpha}{2}}}{\sqrt{n}}\right)=1-\alpha\\ &P\left(\overline{X}-\dfrac{\sigma u_{\frac{\alpha}{2}}}{\sqrt{n}}\leqslant\mu\leqslant\overline{X}+\dfrac{\sigma u_{\frac{\alpha}{2}}}{\sqrt{n}}\right)=1-\alpha \end{align*} P(u2ασn(Xμ)u2α)=1αP(nσu2αXμnσu2α)=1αP(Xnσu2αμX+nσu2α)=1α

也就是说,有 1−α1-\alpha1α 的把握,认为 μ\muμ 在区间 [X‾−σuα2n,X‾+σuα2n]\left[\overline{X}-\dfrac{\sigma u_{\frac{\alpha}{2}}}{\sqrt{n}}, \overline{X}+\dfrac{\sigma u_{\frac{\alpha}{2}}}{\sqrt{n}}\right][Xnσu2α,X+nσu2α]

2、σ2\sigma^2σ2 未知,对 μ\muμ 的区间估计:

构造枢轴变量:T=n(X‾−μ)S∼t(n−1)T=\dfrac{\sqrt{n}(\overline{X}-\mu)}{S}\sim t(n-1)T=Sn(Xμ)t(n1)

P(−tα2(n−1)⩽n(X‾−μS⩽tα2(n−1))=1−α⇒P(X‾−Sntα2(n−1)⩽μ⩽X‾+Sntα2(n−1))=1−α\begin{align*} &P\left(-t_{\frac{\alpha}{2}}(n-1)\leqslant\dfrac{\sqrt{n}(\overline{X}-\mu}{S}\leqslant t_{\frac{\alpha}{2}}(n-1)\right)=1-\alpha\\ &\Rightarrow P\left(\overline{X}-\dfrac{S}{\sqrt{n}}t_{\frac{\alpha}{2}}(n-1) \leqslant \mu \leqslant \overline{X}+\dfrac{S}{\sqrt{n}}t_{\frac{\alpha}{2}}(n-1)\right)=1-\alpha \end{align*} P(t2α(n1)Sn(Xμt2α(n1))=1αP(XnSt2α(n1)μX+nSt2α(n1))=1α

也就是说,有 1−α1-\alpha1α 的把握,认为 μ\muμ 在区间 [X‾−Sntα2(n−1),X‾+Sntα2(n−1)]\left[\overline{X}-\dfrac{S}{\sqrt{n}}t_{\frac{\alpha}{2}}(n-1), \overline{X}+\dfrac{S}{\sqrt{n}}t_{\frac{\alpha}{2}}(n-1)\right][XnSt2α(n1),X+nSt2α(n1)]

3、μ\muμ 已知,对 σ2\sigma^2σ2 的区间估计:

构造枢轴变量:χ2=1σ2∑i=1n(Xi−μ)2∼χ2(n)\chi^2=\dfrac{1}{\sigma^2}\sum\limits_{i=1}^n(X_i-\mu)^2\sim \chi^2(n)χ2=σ21i=1n(Xiμ)2χ2(n),给定 1−α1-\alpha1αχ1−α22(n)\chi^2_{1-\frac{\alpha}{2}}(n)χ12α2(n)χα22(n)\chi^2_{\frac{\alpha}{2}}(n)χ2α2(n)

注意:之所以不继续使用正态分布的枢轴变量,是因为 σ\sigmaσ 在开平方后不是无偏估计

P(χ1−α22(n)⩽1σ2∑i=1n(Xi−μ)2⩽χα22(n))=1−α⇒∑i=1n(Xi−μ)2χα22(n)⩽σ2⩽∑i=1n(Xi−μ)2χ1−α22(n)\begin{align*} &P\left(\chi^2_{1-\frac{\alpha}{2}}(n)\leqslant\dfrac{1}{\sigma^2}\sum_{i=1}^n(X_i-\mu)^2\leqslant\chi^2_{\frac{\alpha}{2}}(n)\right)=1-\alpha\\ &\Rightarrow \dfrac{\sum_{i=1}^n(X_i-\mu)^2}{\chi^2_{\frac{\alpha}{2}}(n)}\leqslant\sigma^2\leqslant\dfrac{\sum_{i=1}^n(X_i-\mu)^2}{\chi^2_{1-\frac{\alpha}{2}}(n)} \end{align*} P(χ12α2(n)σ21i=1n(Xiμ)2χ2α2(n))=1αχ2α2(n)i=1n(Xiμ)2σ2χ12α2(n)i=1n(Xiμ)2

也就是说,有 1−α1-\alpha1α 的把握,认为 σ2\sigma^2σ2 在区间 [∑i=1n(Xi−μ)2χα22(n),∑i=1n(Xi−μ)2χ1−α22(n)]\left[\dfrac{\sum_{i=1}^n(X_i-\mu)^2}{\chi^2_{\frac{\alpha}{2}}(n)},\dfrac{\sum_{i=1}^n(X_i-\mu)^2}{\chi^2_{1-\frac{\alpha}{2}}(n)}\right][χ2α2(n)i=1n(Xiμ)2,χ12α2(n)i=1n(Xiμ)2]

4、μ\muμ 未知,对 σ2\sigma^2σ2 的区间估计:

构造枢轴变量:χ2=(n−1)S2σ2∼χ2(n−1)\chi^2=\dfrac{(n-1)S^2}{\sigma^2}\sim \chi^2(n-1)χ2=σ2(n1)S2χ2(n1),给定 1−α1-\alpha1αχ1−α22(n−1)\chi^2_{1-\frac{\alpha}{2}}(n-1)χ12α2(n1)χα22(n−1)\chi^2_{\frac{\alpha}{2}}(n-1)χ2α2(n1)

P(χ1−α22(n−1)⩽(n−1)S2σ2⩽χα22(n−1))=1−α⇒P((n−1)S2χα22(n−1)⩽σ2⩽(n−1)S2χ1−α22(n−1))=1−α\begin{align*} &P\left(\chi^2_{1-\frac{\alpha}{2}}(n-1)\leqslant\dfrac{(n-1)S^2}{\sigma^2}\leqslant\chi^2_{\frac{\alpha}{2}}(n-1)\right)=1-\alpha\\ &\Rightarrow P\left(\dfrac{(n-1)S^2}{\chi^2_{\frac{\alpha}{2}}(n-1)}\leqslant\sigma^2\leqslant\dfrac{(n-1)S^2}{\chi^2_{1-\frac{\alpha}{2}}(n-1)}\right)=1-\alpha \end{align*} P(χ12α2(n1)σ2(n1)S2χ2α2(n1))=1αP(χ2α2(n1)(n1)S2σ2χ12α2(n1)(n1)S2)=1α

也就是说,有 1−α1-\alpha1α 的把握,认为 σ2\sigma^2σ2 在区间 [(n−1)S2χα22(n−1),(n−1)S2χ1−α22(n−1)]\left[\dfrac{(n-1)S^2}{\chi^2_{\frac{\alpha}{2}}(n-1)},\dfrac{(n-1)S^2}{\chi^2_{1-\frac{\alpha}{2}}(n-1)}\right][χ2α2(n1)(n1)S2,χ12α2(n1)(n1)S2]

http://www.dtcms.com/a/291524.html

相关文章:

  • Java IO 流详解:从基础到实战,彻底掌握输入输出编程
  • 自定义命令行解释器shell
  • Android开发中Crash治理方案
  • C++中的detach
  • Python打卡Day20 常见的特征筛选算法
  • C 语言的指针复习笔记
  • 圆柱电池自动分选机:全流程自动化检测的革新之路
  • 大模型中的Actor-Critic机制
  • 嵌入式学习笔记--MCU阶段--DAY08总结
  • 【Java基础03】Java变量2
  • seata at使用
  • 自然语言推理技术全景图:从基准数据集到BERT革命
  • 设备虚拟化技术-IRF
  • 利用DeepSeek编写批量输出多个主机的磁盘状况的脚本
  • 携“养鲜”魔法赴中卫,容声冰箱让石头缝里的鲜甜走得更远
  • 前端之学习后端java小白(一)之SDKMAN及helloword
  • EcoVadis评估:为企业带来的多重价值与竞争优势
  • QT跨平台应用程序开发框架(11)—— Qt系统相关
  • STM32F1使用volatile关键字避免内存优化
  • 基于springboot+vue开发的图书馆座位预约系统【源码+sql+可运行】【50721
  • 在安卓开发中,多次点击启动 Service 会有什么问题?
  • 关键成功因素法(CSF)深度解析:从战略目标到数据字典
  • 后训练(Post-training)语言模型
  • NuGet02-包制作及管理
  • 本地部署Nacos开源服务平台,并简单操作实现外部访问,Windows 版本
  • Oracle数据库索引性能机制深度解析:从数据结构到企业实践的系统性知识体系
  • 【python数据结构算法篇】python数据结构
  • 数据库的介绍和安装
  • Qualcomm Linux 蓝牙指南学习--验证 Fluoride 协议栈的功能(2)
  • day59-可观测性建设-zabbix自定义监控项