RMSE可以融合均值与标准差
均方根误差与均值和标准差的关系
均方根误差的定义
均方根误差的计算方法
均方根误差又能表示误差的大小和误差的波动情况,但在定义中看不出来
好的,我们来推导一下 均方根误差(RMSE, Root Mean Square Error) 与 误差的均值(Mean Error) 和 标准差(Standard Deviation) 之间的数学关系。
✅ 1. 定义:
设某变量的误差为:
e i = x ^ i − x i e_i = \hat{x}_i - x_i ei=x^i−xi
其中:
- x ^ i \hat{x}_i x^i 是估计值,
- x i x_i xi 是真实值,
- e i e_i ei 是误差。
一组误差 { e 1 , e 2 , … , e n } \{e_1, e_2, \dots, e_n\} {e1,e2,…,en} 的:
均值(Mean Error)定义为:
μ = 1 n ∑ i = 1 n e i \mu = \frac{1}{n} \sum_{i=1}^n e_i μ=n1i=1∑nei
标准差(Standard Deviation)定义为:
σ = 1 n ∑ i = 1 n ( e i − μ ) 2 \sigma = \sqrt{\frac{1}{n} \sum_{i=1}^n (e_i - \mu)^2} σ=n1i=1∑n(ei−μ)2
均方根误差(RMSE)定义为:
R M S E = 1 n ∑ i = 1 n e i 2 \mathrm{RMSE} = \sqrt{\frac{1}{n} \sum_{i=1}^n e_i^2} RMSE=n1i=1∑nei2
✅ 2. 推导 RMSE 与均值、标准差的关系
我们将 RMSE 表达式展开为:
R M S E 2 = 1 n ∑ i = 1 n e i 2 = 1 n ∑ i = 1 n [ ( e i − μ + μ ) 2 ] \mathrm{RMSE}^2 = \frac{1}{n} \sum_{i=1}^n e_i^2 = \frac{1}{n} \sum_{i=1}^n \left[ (e_i - \mu + \mu)^2 \right] RMSE2=n1i=1∑nei2=n1i=1∑n[(ei−μ+μ)2]
展开平方项:
= 1 n ∑ i = 1 n [ ( e i − μ ) 2 + 2 μ ( e i − μ ) + μ 2 ] = \frac{1}{n} \sum_{i=1}^n \left[ (e_i - \mu)^2 + 2\mu(e_i - \mu) + \mu^2 \right] =n1i=1∑n[(ei−μ)2+2μ(ei−μ)+μ2]
注意到:
- ∑ i = 1 n ( e i − μ ) = 0 \sum_{i=1}^n (e_i - \mu) = 0 ∑i=1n(ei−μ)=0,
- 所以中间项 2 μ ∑ i = 1 n ( e i − μ ) = 0 2\mu \sum_{i=1}^n (e_i - \mu) = 0 2μ∑i=1n(ei−μ)=0
于是:
R M S E 2 = 1 n ∑ i = 1 n ( e i − μ ) 2 + μ 2 = σ 2 + μ 2 \mathrm{RMSE}^2 = \frac{1}{n} \sum_{i=1}^n (e_i - \mu)^2 + \mu^2 = \sigma^2 + \mu^2 RMSE2=n1i=1∑n(ei−μ)2+μ2=σ2+μ2
✅ 3. 最终关系式:
R M S E 2 = σ 2 + μ 2 ⟹ R M S E = σ 2 + μ 2 \boxed{ \mathrm{RMSE}^2 = \sigma^2 + \mu^2 } \quad \Longrightarrow \quad \boxed{ \mathrm{RMSE} = \sqrt{ \sigma^2 + \mu^2 } } RMSE2=σ2+μ2⟹RMSE=σ2+μ2
✅ 说明:
-
如果误差均值为 0(无偏估计),则:
R M S E = σ \mathrm{RMSE} = \sigma RMSE=σ
-
如果误差有偏(均值不为 0),则 RMSE 会大于标准差。
需要我帮你用这关系来计算具体的 RMSE 或者写成 Latex 公式插入表格说明中吗?