当前位置: 首页 > wzjs >正文

设计网站如何推广方案海尔工业互联网公司排名

设计网站如何推广方案,海尔工业互联网公司排名,七牛云服务器,网店设计作用有哪些文章目录1. MAE与MSE的本质区别2. 高斯噪声下的统计特性3. MAE导致稀疏解的内在机制4. 对比总结1. MAE与MSE的本质区别 MAE(Mean Absolute Error)和MSE(Mean Squared Error)是两种常用的损失函数,它们的数学形式决定了…

文章目录

  • 1. MAE与MSE的本质区别
  • 2. 高斯噪声下的统计特性
  • 3. MAE导致稀疏解的内在机制
  • 4. 对比总结

1. MAE与MSE的本质区别

MAE(Mean Absolute Error)和MSE(Mean Squared Error)是两种常用的损失函数,它们的数学形式决定了对误差的不同敏感程度:

  • MAEMAE=1n∑i=1n∣yi−y^i∣\text{MAE} = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i|MAE=n1i=1nyiy^i
  • MSEMSE=1n∑i=1n(yi−y^i)2\text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2MSE=n1i=1n(yiy^i)2

从几何角度看,MSE等价于欧氏距离的平方,而MAE等价于曼哈顿距离。这导致MSE对离群点更加敏感,而MAE更具鲁棒性。

2. 高斯噪声下的统计特性

在噪声服从高斯分布 ϵ∼N(0,σ2)\epsilon \sim \mathcal{N}(0, \sigma^2)ϵN(0,σ2) 的假设下:

  1. MSE是最优损失函数
    MSE对应于高斯噪声下的最大似然估计(MLE)。此时,最小化MSE等价于最大化对数似然函数:
    arg⁡min⁡θ∑i=1n(yi−f(xi;θ))2⇔arg⁡max⁡θ∏i=1n12πσ2exp⁡(−(yi−f(xi;θ))22σ2)\arg\min_{\theta} \sum_{i=1}^{n} (y_i - f(x_i; \theta))^2 \quad \Leftrightarrow \quad \arg\max_{\theta} \prod_{i=1}^{n} \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(y_i - f(x_i; \theta))^2}{2\sigma^2}\right) argθmini=1n(yif(xi;θ))2argθmaxi=1n2πσ21exp(2σ2(yif(xi;θ))2)
    高斯分布的二次指数形式直接对应平方误差。

  2. MAE的统计假设
    MAE对应于噪声服从拉普拉斯分布时的MLE。拉普拉斯分布的概率密度函数为:
    p(ϵ)=12bexp⁡(−∣ϵ∣b)p(\epsilon) = \frac{1}{2b} \exp\left(-\frac{|\epsilon|}{b}\right) p(ϵ)=2b1exp(bϵ)

    arg⁡min⁡θ∑i=1n∣yi−f(xi;θ)∣⇔arg⁡max⁡θ∏i=1n12bexp⁡(−∣yi−f(xi;θ)∣b)\arg\min_{\theta} \sum_{i=1}^{n} |y_i - f(x_i; \theta)| \quad \Leftrightarrow \quad \arg\max_{\theta} \prod_{i=1}^{n} \frac{1}{2b} \exp\left(-\frac{|y_i - f(x_i; \theta)|}{b}\right) argθmini=1nyif(xi;θ)argθmaxi=1n2b1exp(byif(xi;θ))
    此时,最小化MAE等价于最大化拉普拉斯分布下的对数似然。

3. MAE导致稀疏解的内在机制

MAE容易产生稀疏解的根本原因在于其梯度特性:

  1. MAE的梯度恒定
    MAE的梯度为:
    ∂MAE∂θ={+1,if yi−f(xi;θ)>0−1,if yi−f(xi;θ)<0undefined,if yi−f(xi;θ)=0\frac{\partial \text{MAE}}{\partial \theta} = \begin{cases} +1, & \text{if } y_i - f(x_i; \theta) > 0 \\ -1, & \text{if } y_i - f(x_i; \theta) < 0 \\ \text{undefined}, & \text{if } y_i - f(x_i; \theta) = 0 \end{cases} θMAE=+1,1,undefined,if yif(xi;θ)>0if yif(xi;θ)<0if yif(xi;θ)=0
    当参数接近零时,梯度仍保持恒定(±1),促使参数快速收敛到零。

  2. MSE的梯度衰减
    MSE的梯度为:
    ∂MSE∂θ=−2(yi−f(xi;θ))⋅∂f(xi;θ)∂θ\frac{\partial \text{MSE}}{\partial \theta} = -2(y_i - f(x_i; \theta)) \cdot \frac{\partial f(x_i; \theta)}{\partial \theta} θMSE=2(yif(xi;θ))θf(xi;θ)
    当误差接近零时,梯度趋近于零,导致参数更新变得非常缓慢,难以彻底消除小参数。

  3. 几何解释
    从优化角度看,MAE的等高线是菱形(在二维空间中),其顶点位于坐标轴上;而MSE的等高线是圆形。当损失函数的最小值靠近坐标轴时,MAE的等高线更容易与坐标轴相交,从而使某些参数被置零。更多可见 损失函数的等高线与参数置零的关系

    在这里插入图片描述

4. 对比总结

特性MSEMAE
对离群点敏感度高(平方放大误差)低(线性处理误差)
噪声分布假设高斯分布拉普拉斯分布
梯度特性梯度随误差减小而衰减梯度恒定(除零点外)
稀疏性不易产生稀疏解易产生稀疏解
优化稳定性平滑优化,数值稳定性好非光滑优化,可能需要特殊处理

在实际应用中,如果数据包含较多离群点或需要进行特征选择,MAE是更合适的选择;如果追求预测精度且噪声近似高斯分布,MSE通常表现更好。

http://www.dtcms.com/wzjs/585502.html

相关文章:

  • 网站风格设计中国软件是外包公司吗
  • 建设部房地产网站网站建设技术服务协议
  • 网站开发 国际网站邯郸网站设计开发公司
  • 交通银行网站开发建网站用的免费软件
  • 艺术品网站模板做游戏还是做网站好
  • 南京网站开发推南京乐识普陀区建设局网站
  • 电商网站建设任务分解结构西安互联网推广公司
  • cms大型门户网站做马甲的网站
  • php中英双语农业公司网站源码十大软件下载大全免费
  • 木马网站怎么做网站代码查看
  • 那些外国网站设计图多推广app赚钱的平台
  • wordpress建站行吗自己能建设网站
  • 烟台网站制作公司哪家好网页设计范文
  • 佛山h5网站公司网站设计要先做图么
  • 南京网站制作有限公司网页设计购物网站
  • 保姆给老人做爰神马网站wordpress上传pdf文档
  • 广州响应网站建设房地产开发公司简介范文大全
  • wordpress 仿站 教程google store
  • 佛山公司网站推广外包服务wordpress女性模板
  • 网站开发工程师 招聘免费推广平台大全
  • 山东省机关建设网站网页设计与制作基础教程
  • 一个人是否可以做公司网站星月教你做网站回顾文档
  • 专业网站建设知识建网站哪便宜
  • 和平网站制作建筑人才网官方网站查询
  • 网站建设平台接单专业的网站建设制作服务
  • 企业网站建设套餐 网络服务wordpress acf教程
  • 工信部备案网站优化有什么用
  • 音乐网站的设计wordpress主题制作pdf
  • 怎样建设网站优化wordpress 安装第二步
  • 仿win8 html5微网站纯手工代码官方网站开发合同