当前位置：首页 > news >正文

传统联邦 VS 联邦+大模型

news 2025/8/27 12:33:54

1.规模不同

传统FL：多用于小模型或中等模型；模型参数量较小。

FL+LLMs：指的是把大规模预训练模型（LLM、ViT、Diffusion 等） 引入到联邦学习框架中。参数量动辄 亿级甚至千亿级，远超边缘设备的单机算力和存储能力。

2.通信与参数同步

传统FL：用 FedAvg 等方式聚合权重，客户端每轮上传完整模型参数或梯度。

FL+LLMs：直接上传全量参数，带宽和延迟成本极高；须采用 参数高效传输方法（只上传 LoRA 参数/梯度压缩/稀疏更新），只同步小部分可训练参数，降低通信成本。

3.算力与资源分布

传统FL：客户端通常是 手机、IoT 设备、边缘设备，算力有限，可完成小模型训练

FL+LLMs：客户端往往需要 服务器级 GPU/TPU 或 云边协同，更像是 跨机构/跨数据中心 的联合

4.训练目标

传统FL：目标通常是 分类/回归/检测任务，模型直接在联邦框架中训练到收敛。

FL+LLMs：大模型已经预训练好，联邦主要做微调，提示学习，蒸馏。其核心目标是实现：个性化+隐私保护（利用本地数据定制大模型，而不泄露数据）

5. 系统设计与挑战

传统FL：关注点：隐私保护（差分隐私、同态加密）、客户端异质性（数据分布不同）、通信效率。系统复杂度相对低。

FL+LLMs：兼顾超大参数同步开销（通信瓶颈）。显存/内存限制（客户端训练难以承载全量参数）。个性化与泛化的平衡（如何在不同机构数据差异下，保持大模型的通用性和个性化）隐私风险更大（因为大模型更容易记忆数据）。

查看全文

http://www.dtcms.com/a/352427.html

freeModbus TCP收发数据一段时间后，出现掉线情况（time out问题）

依托边缘计算方案，移动云全面化解算力、效率、安全平衡难题

Wireshark捕获数据的四种层次

【Python数据分析】商品数据可视化大屏项目

YggJS RButton 按钮组件 v1.0.0 使用教程

亚马逊运营效能提升：广告策略优化与自配送售后管理的协同路径

Makefile构建优化：提升编译效率的关键

打卡day49

RocketMq程序动态创建Topic

在 Ubuntu 下遇到＜string＞头文件找不到的问题

运筹优化（OR）-在机器学习（ML）浪潮中何去何从？

独孤思维：无限分发，无成本赚钱的副业

JVM分层编译深度解析：完整机制与实践指南

面向世界模型构建的跨模态认知网络工程

the scientist and engineer‘s guide to DSP：1 The Breadth and Depth of DSP 引言

CSS实现内凹圆角边框技巧（高频）

【C++】用哈希表封装unordered_XX

西游记24-26：万寿山，五庄观，镇元子；猴子偷果，猪八戒吃人参果——食而不知其味；逃跑被抓回，替师傅受罚；到处求仙，最终观音菩萨救树

Qt数据结构与编码技巧全解析

LeetCode 2140. 解决智力问题

力扣（滑动窗口最大值）

LeetCode 刷题【53. 最大子数组和】

一篇文章拆解Java主流垃圾回收器及其调优方法。

详解 torch.distributed.all_gather_into_tensor

15.examples\01-Micropython-Basics\demo_yield_task.py 加强版

【实时Linux实战系列】基于实时Linux的生物识别系统

#Linux内存管理学以致用# 请你根据linux 内核struct page 结构体的双字对齐的设计思想，设计一个类似的结构体

【测试需求分析】-需求来源分析（一）

博士招生 | 香港大学 Intelligent Communication Lab 招收全奖博士

【deepseek问答记录】：chatGPT的参数数量和上下文长度有关系吗？

1.规模不同

2.通信与参数同步

3.算力与资源分布

4.训练目标

5. 系统设计与挑战

相关文章：