R语言模型分析(一)(1)
文章目录
- 代码解释
- 预期结果分析
- 结果解读
代码解释
# 简化模型(去掉不显著的cyl6效应)
model_simple <- lm(mpg ~ hp + wt + I(cyl == 8), data = mtcars)# 嵌套模型比较
anova(model_simple, model)
模型说明:
model_simple: 简化模型,包含马力(hp)、车重(wt)和是否为8缸的指示变量model: 完整模型(假设之前已定义),可能包含更多变量,如cyl6效应
预期结果分析
anova比较会输出类似这样的结果:
Analysis of Variance TableModel 1: mpg ~ hp + wt + I(cyl == 8)
Model 2: mpg ~ hp + wt + cyl6 + ... (完整模型)Res.Df RSS Df Sum of Sq F Pr(>F)
1 28 182.76
2 27 170.00 1 12.760 2.0275 0.1657
结果解读
-
F检验: 比较两个模型的拟合优度
- 原假设:简化模型与完整模型无显著差异
- 备择假设:完整模型显著优于简化模型
-
P值判断:
- 如果
Pr(>F) > 0.05: 不能拒绝原假设,简化模型足够好 - 如果
Pr(>F) ≤ 0.05: 拒绝原假设,完整模型显著更好
- 如果
-
实际意义:
- 在这个例子中,由于去掉了不显著的cyl6效应,预期P值会大于0.05
- 说明简化模型在统计上不会显著差于完整模型
- 支持使用更简洁的模型(原则:如无必要,勿增实体)
注意:这种嵌套模型比较是模型选择中常用的方法,帮助我们在模型复杂度和拟合优度之间找到平衡。
