当前位置: 首页 > news >正文

Cross-Silo Prototypical Calibration for Federated Learning with Non-IID Data

在这里插入图片描述
ACMMM 2023, 针对数据异构问题,提出一种跨孤岛原型校准方法 FedCSPC,通过聚类对数据模式进行建模,通过正样本混合和硬负样本挖掘增加样本多样性,对比学习实现跨源特征对齐。

建议先读《No Fear of Heterogeneity: Classifier Calibration for Federated Learning with Non-IID Data》,是在这基础上改的。

论文:arxiv
代码:github

贡献

  1. 提出了一种新颖的跨孤岛原型校准方法,以缓解不同客户端之间数据分布异质性的问题。据我们所知,这是第一种能够将来自不同源的异构特征映射到统一空间的方法。

  2. 提出的 CSPC 模块是对基于客户端方法的正交改进。其即插即用的设计使其易于集成到现有基础设施中,并且在不改变核心组件的情况下增强了泛化能力。

  3. 本研究揭示了客户端之间不一致的特征空间对联邦模型有效适应所有客户端提出了挑战。我们验证了 FedCSPC 能够有效解决这一问题。

总结一下就是:(1)第一个将多客户端特征映射到同一空间,(2)多中心聚类(kmeas)得到多个原型特征,采样出更多原型,(3)特征内推和外插,生成正样本难样本,对比算法校准,(4)生成知识原型,用最近距离判断类别

动机

这篇文章的动机分析不是很明确,就说是数据异构,写的很泛。

算法流程

分成客户端和服务端两部分。具体流程和NIPS2021的那篇CCVR一样。客户端用全局原型和标签计算损失,将聚类原型和模型传到server。服务端呢(默认结合FedAvg,聚合全局模型)插值原型得到更多的原型,经过投影层映射到同一空间,用伪标签对比学习对齐特征(仅更新投映+分类层),将更新后的全局模型(特征提取层,单纯靠聚合得到)和全局原型(重复采样再平均得到)发送客户端。
PS:这里需要注意的是,模型分成特征提取器和分类器(投影层+预测层)两部分。全局更新时其中特征提取器单纯靠聚合实现(结合fedavg的时候),用原型来训练分类器。
在这里插入图片描述

DataPrototypical Modeling (DPM) module

数据原型建模(DPM)模块。如下图所示,本地阶段改进有两个方面,一个是和原型的损失定义为点、角、线三个,其中 点损失用的是对比学习的方法(类似三元组损失),角和线损失则是和全局原型对应的L1\L2损失。这里公式中, f f f 表示本地提取的原型特征, u g + u_g^+ ug+

相关文章:

  • 【操作系统安全】任务6:Linux 系统文件与文件系统安全 学习指南
  • 【项目合集】基于ESP32的智能化妆柜
  • Linux进程信号(上)
  • Python第五章03:函数返回值和None类型
  • 网络编程知识预备阶段
  • 东隆科技携手PRIMES成立中国校准实验室,开启激光诊断高精度新时代
  • 【免费】2004-2017年各地级市实际利用外资数据
  • Grokking System Design 系统设计面试问题
  • 从零开始实现一个HTML5飞机大战游戏
  • java 中散列表(Hash Table)和散列集(Hash Set)是基于哈希算法实现的两种不同的数据结构
  • 【渗透测试】webpack对于渗透测试的意义
  • Linux 如何上传本地文件以及下载文件到本地命令总结
  • WSL2配置Humanoidbench问题mujoco.FatalError: OpenGL version 1.5 or higher required
  • Bash中关于制表符\t站位情况说明
  • 滑动窗口算法详解:从入门到精通
  • 44运营干货:提高用户留存和粘性方式汇总
  • 传输层协议 ——— TCP协议
  • SVG利用+xssgame第8关注入详解
  • 裂缝识别系统 Matlab GUI设计
  • C# Unity 唐老狮 No.10 模拟面试题
  • 山东滕州一车辆撞向公交站台撞倒多人,肇事者被控制,案件已移交刑警
  • 新质观察|“模速空间”如何成为“模范空间”
  • 什么让翻拍“语文”成为短视频新风潮
  • 赵心童世锦赛历史性夺冠,你今天打斯诺克很可能订不到位
  • 五一假期上海境外来沪消费4.55亿元,同比增长211.6%
  • 马丽称不会与沈腾终止合作,“他是我的恩人,也是我的贵人”