当前位置: 首页 > news >正文

机器学习数学基础:31.Z检验

Z检验全面教程


一、核心概念与适用条件

1. 定义与原理

Z检验是基于标准正态分布的假设检验方法,用于判断样本均值与总体均值(或两样本均值)的差异是否具有统计学意义。其核心是通过计算Z值(标准分),量化观测数据与原假设之间的偏离程度。

2. 适用场景

  • 单样本Z检验:验证样本均值是否等于已知总体均值(需已知总体标准差)
  • 双样本Z检验:比较两个独立大样本的均值差异(需已知或可估计总体标准差)
  • 比率Z检验:检验比例或概率差异(如转化率、治愈率等)

3. 必要条件

  • 样本量 ≥30(大样本中心极限定理保障)
  • 总体服从正态分布(或样本量足够大)
  • 总体标准差已知/可估计

二、假设检验四步法

步骤1:建立假设

  • 原假设(H₀):无显著差异(如 μ=μ₀ 或 μ₁=μ₂)
  • 备择假设(H₁):存在显著差异(如 μ≠μ₀ 或 μ₁≠μ₂)

步骤2:计算Z统计量

单样本检验公式
Z = X ˉ − μ 0 σ / n Z = \frac{\bar{X} - \mu_0}{\sigma/\sqrt{n}} Z=σ/n Xˉμ0
其中 X ˉ \bar{X} Xˉ为样本均值, μ 0 \mu_0 μ0为总体均值, σ \sigma σ为总体标准差,n为样本量

双样本检验公式
Z = ( X ˉ 1 − X ˉ 2 ) σ 1 2 n 1 + σ 2 2 n 2 Z = \frac{(\bar{X}_1 - \bar{X}_2)}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} Z=n1σ12+n2σ22 (Xˉ1Xˉ2)
σ 1 2 , σ 2 2 \sigma_1^2,\sigma_2^2 σ12,σ22为两总体方差

步骤3:确定临界值

查Z表获取临界值(常用α=0.05对应±1.96)

步骤4:决策与结论

  • |Z计算| > |Z临界| → 拒绝H₀
  • P值 < α → 拒绝H₀

三、经典案例解析

案例1:单样本Z检验(零件检测)

场景:某螺栓标准长度为120mm,已知总体标准差σ=5mm。质检员抽检50个产品,测得平均长度121.5mm,判断产品是否合格。

计算过程

  1. 设H₀: μ=120;H₁: μ≠120(α=0.05)
  2. 代入公式:
    Z = 121.5 − 120 5 / 50 = 1.5 0.707 = 2.12 Z = \frac{121.5-120}{5/\sqrt{50}} = \frac{1.5}{0.707} = 2.12 Z=5/50 121.5120=0.7071.5=2.12
  3. 对比临界值:|2.12| >1.96
  4. 结论:拒绝H₀,产品长度显著偏离标准

案例2:双样本Z检验(药物疗效)

场景:比较新旧降压药效果,旧药组n₁=45, X ˉ 1 \bar{X}_1 Xˉ1=18mmHg,σ₁=4;新药组n₂=40, X ˉ 2 \bar{X}_2 Xˉ2=15mmHg,σ₂=3.5。检验疗效差异(α=0.01)

计算过程

  1. 设H₀: μ₁=μ₂;H₁: μ₁≠μ₂
  2. 计算Z值:
    Z = 18 − 15 4 2 45 + 3. 5 2 40 = 3 0.356 + 0.306 = 3 0.814 = 3.68 Z = \frac{18-15}{\sqrt{\frac{4^2}{45}+\frac{3.5^2}{40}}} = \frac{3}{\sqrt{0.356+0.306}} = \frac{3}{0.814} = 3.68 Z=4542+403.52 1815=0.356+0.306 3=0.8143=3.68
  3. 查临界值(α=0.01):±2.58
  4. 结论:|3.68|>2.58,拒绝H₀,新药效果显著更优

案例3:比率Z检验(临床试验)

场景:试验组105人中76人症状缓解,对照组111人中49人缓解,比较缓解率差异(α=0.05)

计算过程

  1. 设H₀: p₁=p₂;H₁: p₁≠p₂
  2. 计算合并率:
    p ^ = 76 + 49 105 + 111 = 125 216 = 0.5787 \hat{p} = \frac{76+49}{105+111} = \frac{125}{216} = 0.5787 p^=105+11176+49=216125=0.5787
  3. 计算标准误:
    S E = p ^ ( 1 − p ^ ) ( 1 105 + 1 111 ) = 0.5787 × 0.4213 × 0.0187 = 0.0675 SE = \sqrt{\hat{p}(1-\hat{p})(\frac{1}{105}+\frac{1}{111})} = \sqrt{0.5787×0.4213×0.0187} = 0.0675 SE=p^(1p^)(1051+1111) =0.5787×0.4213×0.0187 =0.0675
  4. 计算Z值:
    Z = 0.7238 − 0.4414 0.0675 = 4.18 Z = \frac{0.7238-0.4414}{0.0675} = 4.18 Z=0.06750.72380.4414=4.18
  5. 对比临界值1.96,结论:拒绝H₀,缓解率差异显著

四、注意事项

  1. 小样本优先使用t检验
  2. 比率检验需满足np>5且n(1-p)>5
  3. 双样本检验要求数据独立性
  4. 单侧检验需调整假设方向与临界值

本教程完整呈现Z检验的理论框架与实操流程,通过三大经典案例演示不同场景下的计算逻辑,可作为统计分析的标准参考指南。

相关文章:

  • [python脚本]论文1.(一)CPU/内存数据分析和分组
  • 【AI】DeepSeek 概念/影响/使用/部署
  • Python 高级特性-迭代器
  • 【练习】【子集NO.1】力扣78. 子集
  • 【Research Proposal】基于提示词方法的智能体工具调用研究——难点
  • 解决 Nginx 代理后 HTTP 头部丢失的问题:以 access_token 为例
  • 蛋白质研究常用数据库系列1
  • Windows 下 Visual Studio Code 常用快捷键指南
  • IoT设备硬件攻击技术与接口漏洞利用
  • 【量化科普】Arbitrage,套利
  • The Heliosphere 日球层
  • 如何让大模型理解变量,扣子(coze)智能体中变量描述起着啥作用?程序员看了集体惊呆!扣子免费系列教程(19)
  • 记录spring-boot 3.X版本整合RocketMq
  • AMBA-CHI协议详解(二十)
  • 智慧废品回收小程序php+uniapp
  • PD协议芯片:推动快充技术革新的核心引擎
  • 了解 RAG 第二部分:经典 RAG 的工作原理
  • Java 值传递
  • 轻量级日志管理平台Grafana Loki
  • LeetCode 热题 100 11. 盛最多水的容器
  • 好的国外设计网站推荐/百度推广登陆平台
  • 桂林网站建设凡森网络/百度云账号登录
  • 移动端友好网站/2022年十大网络流行语发布
  • 沈阳网站推广优化公司哪家好/站长统计推荐
  • 北京做药流凤凰网站/最新时事热点
  • 企业网站的基本内容和营销功能/广告公司推广