当前位置: 首页 > news >正文

联邦学习中常用的聚合方式

在联邦学习中,聚合方式的选择直接影响模型性能、抗攻击能力和隐私保护效果。以下是几种常用的聚合方式及其原理、特点和应用场景:

一、联邦平均(FedAvg)

二、中位数聚合(Median Aggregation)

三、Krum 聚合

原理
  1. 计算每个客户端更新与其他所有更新的欧氏距离之和;
  2. 选择距离和最小的K-2f-2 个更新(K 为客户端总数,f为恶意客户端数),再取平均。
特点
  • 优势:理论上可抵抗  f\leqslant (K-3)/2个恶意客户端,比中位数聚合更鲁棒。
  • 不足:计算复杂度高,适用于小规模客户端场景。
应用场景
  • 对安全性要求极高且客户端数量较少的场景。

四、Trimmed Mean 聚合

原理
  1. 将客户端更新按某种度量(如范数)排序;
  2. 剔除最大的 f 个和最小的 f 个更新,对剩余更新取平均。
特点
  • 优势:可抵抗 f个恶意更新,灵活性高于中位数聚合(可自定义剔除比例)。
  • 不足:需预先知道恶意客户端数量 f
应用场景
  • 已知恶意客户端比例的场景,如工业物联网设备更新。

五、加权中位数(Weighted Median)

原理

结合FedAvg(联邦平均)的加权逻辑与中位数的抗噪特性:

  1. 对每个客户端更新赋予权重(如数据量 );
  2. 按更新值排序后,找到累计权重超过总权重一半的最小更新值。
特点
  • 优势:兼顾数据量权重与抗攻击能力,比普通中位数更适应数据异构场景。
  • 不足:计算复杂度高于普通中位数。
应用场景
  • 数据量差异大且存在恶意客户端的场景(如跨企业联邦学习)。

六、去中心化聚合(Decentralized Aggregation)

原理

客户端不与中心服务器通信,仅与相邻客户端交换模型更新,通过分布式共识(如 gossip 协议)实现聚合。

特点
  • 优势:无中心节点,抗单点故障,隐私泄露风险低。
  • 不足:收敛速度慢,适用于对通信可靠性要求高的场景。
应用场景
  • 边缘计算、传感器网络等分布式环境。

七、与隐私技术结合的聚合方式

1. 差分隐私联邦平均(DP-FedAvg)
  • 原理:对 FedAvg 的更新添加差分隐私噪声,公式为:\Delta w_{\text{DP-FedAvg}} = \frac{1}{N} \sum \left( n_i \cdot \Delta w_i + \text{Laplace}(\epsilon) \right)
  • 其中 \varepsilon 为隐私预算参数。为隐私预算参数。
2. 同态加密聚合(HE Aggregation)
  • 原理:客户端用同态加密技术对更新加密,服务器在密文上直接聚合,解密后得到结果,避免泄露原始更新。

八、各聚合方式对比表

聚合方式核心逻辑抗恶意攻击能力通信 / 计算开销适用场景
联邦平均(FedAvg)数据量加权平均信任环境、效率优先
中位数聚合排序取中位数$f < 50\%$不可信环境、抗攻击需求
Krum 聚合距离和最小化f\leqslant(K-3)/2高安全需求、小规模客户端
Trimmed Mean剔除极端值后平均中(需已知 f已知恶意比例的场景
加权中位数加权 + 中位数数据异构且存在恶意客户端
去中心化聚合分布式共识强(无中心节点)边缘计算、分布式网络

九、选择策略建议

  • 优先 FedAvg:若场景信任度高、数据分布均衡,追求效率和简单性。
  • 结合中位数 / Krum:若存在恶意攻击风险(如跨机构合作),需增强鲁棒性。
  • 搭配隐私技术:无论采用哪种聚合方式,在涉及敏感数据时(如医疗、金融),建议结合差分隐私或同态加密,从 “抗攻击” 和 “隐私保护” 双维度保障系统安全。

http://www.dtcms.com/a/244559.html

相关文章:

  • 初识 Redis:从入门到应用的全面指南
  • React Context 性能问题及解决方案深度解析
  • 物联网基础概述【一】
  • 开疆智能ModbusTCP转Canopen网关连接汇川AM403PLC与编码器配置案例
  • Vue.js $emit的介绍和简单使用
  • 商品中心—3.商品可采可补可售的技术文档下
  • UE5 学习系列(四)导入模型资产
  • Hydra 工具小白入门教程指导篇
  • RawTherapee:专业RAW图像处理,免费开源
  • CST同轴空气线模型参数定义方法
  • YOLOv1 技术详解:正负样本划分与置信度设计
  • 第二章——线性表之循环链表、静态链表
  • 结合redis实现文件分片秒传断点续传
  • TI dsp Timer 定时器
  • 汽车电子行业的高效研发利器——全星研发项目管理APQP软件系统
  • 开疆智能ModbusTCP转Canopen网关连接AGV地标传感器
  • 楼宇自控整合空调照明安防系统,构建建筑环境智能管理高效体系
  • 第七章——8天Python从入门到精通【itheima】-81~84(函数的多返回值+函数多种传参方式+函数作为参数传递+lambda函数)
  • 大模型技术30讲-4-彩票假设
  • 第六讲——一元函数微分学的应用之中值定理、微分等式与微分不等式
  • 面壁智能MiniCPM4.0技术架构与应用场景
  • OAuth 2.0中/oauth/authorize接口的核心作用解析
  • 大模型的类别对比:LLM、Text Embedding、Rerank、Speech to text,TTS
  • 14.计算机网络End
  • Docker三大核心组件详解:镜像、容器、仓库的协作关系
  • 想考Kubernetes认证?CKA考试内容与报名全解析
  • 6. TypeScript 函数
  • 读研一些毕业感想
  • FastAPI的数据契约:Pydantic与SQLModel联手打造健壮API
  • Java多线程—线程池