【SAS逐步回归法】REG过程逐步回归求解最优方程
SAS逐步回归法(Stepwise Regression)是一种变量选择技术,通过迭代添加或剔除预测变量,构建最优线性回归模型。其目标是在保持模型简洁性的同时最大化解释力,适用于高维数据或变量相关性较强的情景。
目录
【示例】
SAS代码
逐步选择过程
逐步选择汇总
y的拟合诊断
y的回归变量值-残差值
【示例】
Y与有相关关系,考虑回归模型,用逐步回归法求“最优”回归方程,观测数据如下:
使用SAS中的REG过程来完成逐步回归计算,假设引入变量的显著性水平为0.10,剔除变量的显著性水平为0.10
SAS代码
data d1;input x1-x4 y ;cards;
7 26 6 60 78.5
1 29 15 52 74.3
11 56 8 20 104.3
11 31 8 47 87.6
7 52 6 33 95.9
11 55 9 22 109.2
3 71 17 6 102.7
1 31 22 44 72.5
2 54 18 22 93.1
21 47 4 26 115.9
1 40 23 34 83.8
11 66 9 12 113.3
10 68 8 12 109.4
;proc reg data=d1;model y=x1-x4/selection=stepwisesle=0.10 sls=0.10;
run;
quit;
逐步选择过程
计算各情况R方值
引入一个最优变量
继续引入最优变量
继续引入最优变量
可以发现引入新变量后原变量x4变得不再重要,故第四步剔除x4
得到最优回归模型:
Y与x1,x2的二元回归模型的决定系数