机器学习笔记-假设检验
📘 机器学习笔记-假设检验
章节:课时16 比较检验(3)
主题:假设检验在模型比较中的应用
🧠 一、课程核心内容
📍假设检验在模型比较中的应用
以一元线性回归为例,假设检验可用于以下比较和推断:
-
回归系数显著性检验
公式:𝑦 = β₀ + β₁x- 检验自变量 x 对因变量 y 的影响是否显著
- 原假设:H₀: β₁ = 0(x 与 y 无线性关系)
- 备择假设:H₁: β₁ ≠ 0
- 使用 T 检验,若拒绝 H₀,则 x 与 y 存在线性关系
-
回归方程显著性检验
公式:𝑦 = β₀ + β₁x- 检验整个回归方程是否显著
- 原假设:H₀: β₁ = 0
- 备择假设:H₁: β₁ ≠ 0
- 使用 F 检验,若拒绝 H₀,则方程显著,模型有意义
-
相关系数显著性检验
- 检验两个变量间的相关系数是否显著
- 原假设:H₀: ρ = 0
- 备择假设:H₁: ρ ≠ 0
- 若拒绝 H₀,说明变量之间存在显著相关关系
📊 二、课程逻辑图解
graph TD
A[建立假设 H₀、H₁] --> B[选择检验方法(T / F / 相关系数)]
B --> C[计算统计量]
C --> D{比较p值与α}
D -->|p ≤ α| E[拒绝原假设 → 存在线性关系]
D -->|p > α| F[接受原假设 → 关系不显著]
🧩 三、在项目管理中的启发
| 学到的概念 | 实际项目场景 | 管理启示 |
|---|---|---|
| 回归系数检验 | 判断某因素(如工期或人力)是否显著影响项目交付 | 数据化识别“真正重要的变量” |
| 方程显著性检验 | 验证项目进度预测模型整体是否有效 | 模型评估,不盲信预测 |
| 相关系数检验 | 检查两个指标间的相关性(如Bug数与测试时长) | 理解变量关系,优化决策 |
🧰 四、快速实操(以项目管理为例 Python 示例)
from scipy import stats
import numpy as np# 示例:检验任务完成时间与工作量是否相关
x = np.array([3, 5, 8, 10, 12]) # 工作量
y = np.array([7, 10, 13, 17, 20]) # 完成时间r, p = stats.pearsonr(x, y)
print(f"相关系数: {r:.3f}, p值: {p:.3f}")if p < 0.05:print("存在显著相关关系")
else:print("未发现显著相关关系")
