当前位置: 首页 > news >正文

评价指标MAE 、MSE 、R2

1. 平均绝对误差(Mean Absolute Error, MAE)

定义:

MAE 计算的是预测值真实值之间差值的绝对值的平均数。它直接衡量了预测值与真实值之间的平均差距大小。

公式:

$\text{MAE} = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i|$

其中:

  • $n$是样本总数。

  • $y_i$ 是第 $i$ 个样本的真实值(标签)。

  • $\hat{y}_i$ 是第 $i$个样本的预测值。

评估意义:
  • 单位: MAE 的单位与原始数据(如纯度百分比)的单位相同,因此具有很好的可解释性

  • 特性: MAE 采用绝对值,对所有误差(无论大小)都是等比例惩罚。它对异常值(Outliers)的鲁棒性比 MSE 更好。

  • 最佳值: 0(表示完美预测)。


2. 均方误差(Mean Squared Error, MSE)

定义:

MSE 计算的是预测值与真实值之间差值的平方的平均数。

公式:

$\text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2$

评估意义:

  • 单位: MSE 的单位是原始数据单位的平方,可解释性不如 MAE 直观。

  • 特性: 由于使用了平方项,MSE 对较大的误差(异常值)给予更高的惩罚。这使得模型在训练时会更关注那些偏离较大的样本,努力减小大的预测误差。

  • 最佳值: 0(表示完美预测)。

  • RMSE: 均方根误差(RMSE = $\sqrt{\text{MSE}}$)更常用,它将 MSE 开方后,单位又回到了原始数据单位,恢复了部分可解释性。


3. 决定系数(Coefficient of Determination, $R^2$

定义:

$R^2$(R-squared)也称作拟合优度,它衡量了模型对真实数据的解释能力。它表明了模型预测结果的方差占真实数据总方差的比例。

公式:

$R^2 = 1 - \frac{\sum_{i=1}^{n} (y_i - \hat{y}_i)^2}{\sum_{i=1}^{n} (y_i - \bar{y})^2} = 1 - \frac{\text{MSE} \cdot n}{\text{TSS}}$

其中:

  • $\sum_{i=1}^{n} (y_i - \hat{y}_i)^2$残差平方和(RSS),代表模型未解释的部分(即误差)。

  • $\sum_{i=1}^{n} (y_i - \bar{y})^2$总平方和(TSS),代表真实数据的总方差。

  • $\bar{y}$是真实值的平均值。

评估意义:
  • 单位: 无量纲,通常是一个百分比(或介于$-\infty$到 1 之间)。

  • 特性:$R^2$ 衡量的是相对性能

    • $R^2 = 1$ 模型完美预测,误差为零。

    • $R^2 = 0$ 模型的预测效果与简单地使用真实值的平均值进行预测的效果一样差

    • $R^2 < 0$ 模型预测结果比直接取平均值还要差,说明模型非常失败。

  • 在软测量中的要求: 在工业软测量中,为了保证预测值可以实际应用于控制系统,通常要求 $R^2$达到一个非常高的水平,例如$0.9$以上,甚至 $0.95$以上。


总结与对比(在软测量中的应用)

指标优势劣势侧重评估点
MAE单位与实际值相同,可解释性好,对异常值鲁棒性强。对大误差的惩罚相对较轻。预测的平均准确度,实际误差有多大。
MSE对大误差有更大的惩罚,训练中能迫使模型关注大偏差样本。单位不直观,可解释性差(RMSE 可改善)。模型稳定性,是否有不可接受的巨大误差。
$R^2$无量纲,衡量模型对数据的解释能力,提供了相对基准。易受样本量和模型复杂度的影响。模型拟合优度,模型预测值方差占真实值方差的比例。

在评估软测量模型时,通常会同时使用这三个指标来获得一个全面、多维度的性能评估。

http://www.dtcms.com/a/610326.html

相关文章:

  • 珠海市律师网站建设怎么样wordpress教程 页面
  • 便利的合肥网站建设专业的医疗行业网站模板
  • PostgreSQL (零-1) Windows安装PostgreSQL
  • 宁波网站建设公司名单推荐景安备案域名购买
  • FPGA语法基础(三):Verilog 位选择语法详解
  • 【Linux笔记】网络部分——NAT-代理-网络穿透
  • 第二章:物理层
  • asp网站程序网页设计视频网站建设
  • 网站小图标怎么做网页制作设计思路
  • 朝阳专业做网站青岛平台网站建设
  • spiderdemo第三题
  • PostgreSQL 实战指南(面向 MySQL 开发者)
  • 山东省建设执业师之家官方网站网站建设培训心得体会
  • 充电桩小程序开发实战:从零到一搭建完整系统【源码+解析+文档】
  • 配置安装mmsegmentation并同步至远程服务器
  • 了解一下Sentry(一个开源的实时错误监控平台)
  • 企业网站建设规划书网站建设制作要学什么软件
  • C#VB.NET中实现可靠的文件监控(新建、删除、改名、内容修改等事件的准确捕获)​
  • Python数据科学与图像处理利器组合:Prophet、Arch、Scikit-image、Pillow-heif用法全解析
  • wordpress 4.6.1海外广告优化师
  • 【运维】GNU/Linux 入门笔记
  • 长沙鞋网站建设煤矿建设工程质量监督总站网站
  • 学做川菜下什么网站爱网站黄
  • 前端自定义右键菜单与图片复制(兼容H5)
  • [Switch大气层]纯净版+特斯拉版 20.5.0大气层1.9.5心悦整合包 固件 工具 插件 前端等switch游戏资源下载合集
  • 同样算法的DFS求解数独C和Python程序用时比较
  • vue3+element-china-area-data 实现省市区三级联动
  • Next.js 项目常见报错排查与解决
  • Vue 校验输入时间与当前时间差大于等于3小时
  • html中网站最下面怎么做设计主题网站