一、从一次数据合规审查说起
上个月,客户突然要求我们提供YOLOv11在医疗影像数据上的训练日志和原始数据分布报告——因为他们的数据压根不能离开医院内网。实验室里顿时安静了,我们意识到:传统的集中式训练模式,在隐私敏感场景下根本走不通。
这让我想起了三年前做安防项目时,同样因为人脸数据无法跨区域传输,最终方案被迫降级。现在面对YOLOv11这样的现代检测模型,有没有办法在不移动数据的前提下完成训练?联邦学习(Federated Learning)进入了我们的视野。
二、联邦学习不是简单的分布式训练
很多人第一次听说联邦学习,会联想到传统的分布式训练。这里有个关键区别:分布式训练是把数据切片后分发到各节点,而联邦学习是让模型“跑腿”,数据原地不动。
举个例子,假设我们在三家医院部署YOLOv11:
- 传统方案:把三家的CT影像都传到中央服务器 → 法律上不可行
- 联邦方案:服务器下发初始模型,各家在医院内部训练 → 只传模型参数,不传数据
# 伪代码:客户端本地训练片段defclient_train(local_model