当前位置: 首页 > news >正文

【知识杂记】方差、标准差、均方误差、均方根误差与平均绝对误差,概念、计算公式、物理意义

统计学中的误差衡量指标:方差、标准差、均方误差、均方根误差与平均绝对误差

方差、标准差:与平均值比较

均方误差(MSE)、均方根误差(RMSE)以及平均绝对误差(MAE):与真实值比较

1. 方差(Variance)与标准差(Standard Deviation)

方差和标准差是用来衡量数据集离散程度的两个基本统计量,它们描述了数据点围绕平均值(或期望值)的散布情况。

  • 方差(Variance):
    方差反映了每个数据点与平均值距离的平方的平均值。它的公式如下:
    σ2=∑(xi−μ)2n\sigma^2 = \frac{\sum (x_i - \mu)^2}{n}σ2=n(xiμ)2
    其中,xix_ixi 是数据集中的每个数据点,μ\muμ 是数据集的平均值,而 nnn 是数据点的总数。方差的单位是原始数据单位的平方。

  • 标准差(Standard Deviation):
    标准差是方差的平方根,它将离散程度的度量单位还原为与原始数据相同的单位,因此更具可解释性。
    σ=∑(xi−μ)2n=σ2\sigma = \sqrt{\frac{\sum (x_i - \mu)^2}{n}} = \sqrt{\sigma^2}σ=n(xiμ)2=σ2
    在机器学习中,我们常用方差来衡量模型预测的稳定性。例如,如果一个模型在不同数据集上的预测结果方差很小,说明其预测结果比较稳定。

2. 均方误差(Mean Square Error, MSE)

均方误差是评估回归模型性能最常用的指标之一。它衡量的是模型预测值与真实值之间差异的平方的平均值

  • 公式:
    MSE=∑(Xpred−Xreal)2nMSE = \frac{\sum (X_{pred} - X_{real})^2}{n}MSE=n(XpredXreal)2
    其中,XpredX_{pred}Xpred 是模型的预测值,XrealX_{real}Xreal 是真实值,nnn 是样本总数。

  • 特点:

    • 惩罚大误差: 由于误差被平方,MSE 对较大的误差(离群点)有更强的惩罚作用。这意味着如果你的模型犯了一个很大的错误,MSE 会显著增加。
    • 非线性度量: MSE的单位是原始数据单位的平方,因此不如原始单位那么直观。
    • 可微性: 它是可微的,这使得它在许多优化算法(如梯度下降)中作为损失函数非常有效。

3. 均方根误差(Root Mean Square Error, RMSE)

均方根误差是均方误差的平方根。它的引入主要是为了解决MSE单位不一致的问题,使误差的量纲与原始数据保持一致,从而更易于理解和解释。

  • 公式:
    RMSE=MSE=∑(Xpred−Xreal)2nRMSE = \sqrt{MSE} = \sqrt{\frac{\sum (X_{pred} - X_{real})^2}{n}}RMSE=MSE=n(XpredXreal)2

  • 特点:

    • 单位一致: RMSE的单位与目标变量的单位相同,因此更容易进行直观比较。
    • 保留MSE特性: 它依然保留了MSE对大误差的惩罚特性。因此,RMSE对模型中的异常点(outliers)非常敏感。如果数据集中存在一些极端的预测偏差,RMSE会非常大。
    • 物理意义: 常常被类比为物理学中的“L2L_2L2 范数”,因为它基于欧几里得距离。

4. 平均绝对误差(Mean Absolute Error, MAE)

平均绝对误差是另一种重要的回归模型性能指标,它衡量的是模型预测值与真实值之间绝对误差的平均值

  • 公式:
    MAE=∑∣Xpred−Xreal∣nMAE = \frac{\sum |X_{pred} - X_{real}|}{n}MAE=nXpredXreal

  • 特点:

    • 鲁棒性(Robust): MAE对异常值(outliers)不那么敏感。因为它使用的是绝对值而不是平方,所以大误差不会像在MSE或RMSE中那样被显著放大。这使得它在数据存在较多离群点时是一个更“稳健”的指标。
    • 单位一致: MAE的单位也与目标变量的单位相同,易于理解。
    • 不可微性: 在误差为零的点处,MAE的函数不是严格可微的,这在某些优化算法中可能会带来挑战。它通常被类比为“L1L_1L1 范数”。


总结与比较

缩写/符号中文名称计算公式简单原理物理意义优点缺点
sigma2\\sigma^2sigma2方差
(Variance)
∑(xi−μ)2n\frac{\sum (x_i - \mu)^2}{n}n(xiμ)2计算每个数据点与均值差异的平方的平均值。衡量数据集的离散程度或数据的波动性。理论基础扎实,广泛用于统计学中;可用于衡量模型预测的稳定性。单位是原始数据单位的平方,不直观;对极端值敏感。
sigma\\sigmasigma标准差
(Standard Deviation)
∑(xi−μ)2n\sqrt{\frac{\sum (x_i - \mu)^2}{n}}n(xiμ)2方差的平方根衡量数据集的离散程度,与原始数据单位一致。单位与原始数据相同,更具可解释性;反映了数据点在均值周围的平均散布情况。仍对极端值敏感。
MSE均方误差
(Mean Square Error)
∑(Xpred−Xreal)2n\frac{\sum (X_{pred} - X_{real})^2}{n}n(XpredXreal)2计算每个预测值与真实值差异的平方的平均值。衡量预测值与真实值之间的平均偏离程度。可微,常作为损失函数用于模型优化;对大误差有强惩罚作用。单位与原始数据单位不一致;对异常值非常敏感。
RMSE均方根误差
(Root Mean Square Error)
∑(Xpred−Xreal)2n\sqrt{\frac{\sum (X_{pred} - X_{real})^2}{n}}n(XpredXreal)2均方误差的平方根衡量预测值与真实值之间的平均偏离程度,单位与原始数据相同。单位与原始数据相同,直观易懂;保留了对大误差的惩罚特性。依然对异常值非常敏感,受其影响大。
MAE平均绝对误差
(Mean Absolute Error)
这里放公式会error,具体公式表格下方计算每个预测值与真实值差异的绝对值的平均值。衡量预测值与真实值之间的平均偏离程度,与原始数据单位相同。对异常值具有鲁棒性(不敏感);单位与原始数据相同,易于解释。在零点处不可微,对优化带来挑战;无法有效区分不同程度的误差。

∑∣Xpred−Xreal∣n\frac{\sum |X_{pred} - X_{real}|}{n}nXpredXreal

http://www.dtcms.com/a/340593.html

相关文章:

  • 微型导轨的快速调平技术如何提升激光加工效率?
  • Python默认参数
  • CPTS--Administrator
  • 【clion】调试脚本并cmake构建Fargo项目win32版本
  • Spring Boot 配置
  • C++---向下取整(>>)与向零取整(/)
  • Vue2封装Axios
  • PyTorch - Developer Notes
  • 《录井工程与管理》——第二章井位勘测技术
  • 精品方案 | GCKontrol与OMNeT++联合仿真在机载网络性能分析中的应用
  • 基于单片机环境火灾安全检测
  • 驾驭复杂表单:用 RxJava 实现响应式表单处理
  • mysql-8.0.37-linux-glibc2.12-x86_64安装
  • 数据结构与算法系列(大白话模式)小学生起点(一)
  • 【Kafka】常见简单八股总结
  • 【39】OpenCV C++实战篇——直线拟合、直线测距、平行线段测距;(边缘检测,剔除噪点,轮廓检测,渐进概率霍夫直线)
  • ReAct Agent:让AI像人类一样思考与行动的革命性框架
  • 01_Go语言基础与环境搭建
  • 【自记】Power BI 中 ALLNOBLANKROW的适用场景举例
  • 如何选择汽车ECU的加密方法
  • docker 部署
  • 千康BOH是店易开吗?怎么和金蝶云、用友BIP、鼎捷等ERP集成?
  • 趣打印高级版--手机打印软件!软件支持多种不同的连接方式,打印神器有这一个就够了!
  • 云手机在办公场景中的优势体现
  • 云手机在社交媒体场景中的优势体现在哪些方面?
  • AI大模型×政务热线:数造科技打造企业动态画像的“实时监测引擎”
  • 【网站测试:CORS配置错误引发的安全风险及测试】
  • 力扣【2348. 全0子数组的数目】——从暴力到最优的思考过程
  • 数学建模竞赛中评价类相关模型
  • 多人同时导出 Excel 导致内存溢出