评价指标MAE 、MSE 、R2
1. 平均绝对误差(Mean Absolute Error, MAE)
定义:
MAE 计算的是预测值与真实值之间差值的绝对值的平均数。它直接衡量了预测值与真实值之间的平均差距大小。
公式:
其中:
是样本总数。
是第
个样本的真实值(标签)。
是第
个样本的预测值。
评估意义:
单位: MAE 的单位与原始数据(如纯度百分比)的单位相同,因此具有很好的可解释性。
特性: MAE 采用绝对值,对所有误差(无论大小)都是等比例惩罚。它对异常值(Outliers)的鲁棒性比 MSE 更好。
最佳值: 0(表示完美预测)。
2. 均方误差(Mean Squared Error, MSE)
定义:
MSE 计算的是预测值与真实值之间差值的平方的平均数。
公式:
评估意义:
单位: MSE 的单位是原始数据单位的平方,可解释性不如 MAE 直观。
特性: 由于使用了平方项,MSE 对较大的误差(异常值)给予更高的惩罚。这使得模型在训练时会更关注那些偏离较大的样本,努力减小大的预测误差。
最佳值: 0(表示完美预测)。
RMSE: 均方根误差(RMSE =
)更常用,它将 MSE 开方后,单位又回到了原始数据单位,恢复了部分可解释性。
3. 决定系数(Coefficient of Determination,
)
定义:
(R-squared)也称作拟合优度,它衡量了模型对真实数据的解释能力。它表明了模型预测结果的方差占真实数据总方差的比例。
公式:
其中:
是残差平方和(RSS),代表模型未解释的部分(即误差)。
是总平方和(TSS),代表真实数据的总方差。
是真实值的平均值。
评估意义:
单位: 无量纲,通常是一个百分比(或介于
到 1 之间)。
特性:
衡量的是相对性能。
: 模型完美预测,误差为零。
: 模型的预测效果与简单地使用真实值的平均值进行预测的效果一样差。
: 模型预测结果比直接取平均值还要差,说明模型非常失败。
在软测量中的要求: 在工业软测量中,为了保证预测值可以实际应用于控制系统,通常要求
达到一个非常高的水平,例如
以上,甚至
以上。
总结与对比(在软测量中的应用)
| 指标 | 优势 | 劣势 | 侧重评估点 |
| MAE | 单位与实际值相同,可解释性好,对异常值鲁棒性强。 | 对大误差的惩罚相对较轻。 | 预测的平均准确度,实际误差有多大。 |
| MSE | 对大误差有更大的惩罚,训练中能迫使模型关注大偏差样本。 | 单位不直观,可解释性差(RMSE 可改善)。 | 模型稳定性,是否有不可接受的巨大误差。 |
| 无量纲,衡量模型对数据的解释能力,提供了相对基准。 | 易受样本量和模型复杂度的影响。 | 模型拟合优度,模型预测值方差占真实值方差的比例。 |
在评估软测量模型时,通常会同时使用这三个指标来获得一个全面、多维度的性能评估。
