当前位置: 首页 > news >正文

Error Density-dependent Empirical Risk Minimization

经验误差密度依赖的风险最小化 v.s. 经验风险最小化

论文: 《 Error Density-dependent Empirical Risk Minimization》
发表在: ESWA’24
相关代码: github.com/zxlml/EDERM

研究背景

传统的经验风险最小化(ERM)方法基于平方损失,对异常值敏感,导致泛化性能下降。现有改进方法主要关注误差值的定量关系(如Huber损失、CVaR等),但未能有效利用误差密度的结构信息。异常值通常分布在低密度区域,而高密度区域的样本更具统计意义,因此如何通过误差密度筛选样本以提升鲁棒性成为关键问题。

在这里插入图片描述

核心技术与思想

论文提出误差密度依赖的经验风险最小化(EDERM),核心思想是:

误差密度建模:通过核密度估计(KDE)计算样本的误差密度分布。

高密度区域筛选:利用阈值λ选择误差密度高的样本,构建鲁棒学习目标。

指示函数替代:用平滑函数(如correntropy诱导函数)替代非凸的指示函数,将问题转化为可优化的形式。

数学形式上,EDERM的目标函数为:

在这里插入图片描述
其中ϕ为代理函数,ρE 为KDE估计的误差密度。

核心贡献

  1. 新学习目标:首次将误差密度直接引入ERM框架,提出EDERM方法。

  2. 理论分析:证明EDERM的连续性、平滑性及鲁棒性,并揭示其与CVaR的区别。

  3. 实验验证:在合成数据、UCI数据集、CME数据和图像分类任务中,EDERM在噪声和异常值环境下表现优于传统方法(如Huber、MCC、MoM等),且稳定性更高。

解决的问题

在这里插入图片描述

  1. 异常值敏感性问题:传统ERM因过度关注异常值的平方误差而降低泛化能力。

  2. 误差结构信息利用不足:现有方法依赖误差值的排序或分位数,忽视密度分布隐含的样本聚类特征。

  3. 优化复杂性:通过代理函数将非凸问题转化为可高效求解的形式。

此外,本文中我们还建立了EDERM和经济学中的度量CVaR之间的联系:
在这里插入图片描述

相关文章:

  • 基于IMM算法的目标跟踪,四模型IMM|三维环境|4个模型分别是:CV、左转CT、右转CT、CA(基于EKF,订阅专栏后可获得完整源代码)
  • 计算机视觉之dlib人脸关键点绘制及微笑测试
  • VMware虚拟机IP配置
  • GCC RISCV 后端 -- GCC 构建系统简介
  • 《2025软件测试工程师面试》功能测试篇
  • 6.人工智能与机器学习
  • 通过多线程分别获取高分辨率和低分辨率的H264码流
  • C与C++的区别
  • 大型语言模型中微调和提炼的详细技术比较
  • 【C++】可变模板参数和完美转发
  • 蓝桥杯 之 图形规律
  • rollup是什么?以及它和webpack 和vite的区别
  • 【Web安全方向编程语言学习顺序推荐】
  • 基于 Vue 和 SSM 的前后端分离项目实战:登录与注册功能实现
  • 安卓基础组件Looper - 01 通讯机制简介
  • 【实战 ES】实战 Elasticsearch:快速上手与深度实践-2.1.3时间序列数据优化(Rollover + ILM策略)
  • Leetcode 30. 串联所有单词的子串
  • 小鹏汽车申请注册“P7 Ultra”商标 或为P7车型升级版铺路
  • [java基础知识] java的集合体系Collection(List,Set,Queue),Map
  • 基于python跨平台硬件诊断的工具
  • 美国务院宣布新一轮与伊朗相关的制裁
  • 关于“十五五”,在上海召开的这场座谈会释放最新信号
  • 马上评丨上热搜的协和“4+4”模式,如何面对舆论审视
  • 魔都眼|静安光影派对五一启幕:苏河湾看徐悲鸿艺术画作
  • 屠呦呦当选美国国家科学院外籍院士
  • 美国清洗政治:一幅残酷新世界的蓝图正在展开