One-Shot Clustering for Federated Learning

作者: Maciej Krzysztof Zuziak, Roberto Pellungrini, Salvatore Rinzivillo

发布时间: 2025-03-07

来源: arxiv

研究方向: 联邦学习(Federated Learning)和聚类联邦学习(Clustered Federated Learning)

主要内容

本文提出了一种名为One-Shot Clustered Federated Learning (OCFL)的算法,该算法可以在联邦学习的早期阶段自动检测到合适的聚类时刻,并执行高效的单次聚类,无需调整超参数。OCFL算法基于计算客户梯度的余弦相似度和温度度量,用于检测联邦模型何时开始收敛。

主要贡献

1. 提出了OCFL算法,该算法可以自动检测到合适的聚类时刻,并执行高效的单次聚类。

2. OCFL算法是聚类算法无关的,可以与大多数现有的聚类算法结合使用。

3. 通过实验证明了OCFL算法在聚类性能和个人化方面的优越性,同时保持了可接受的泛化能力。

4. 实验结果表明,OCFL算法可以有效地在早期阶段对客户进行聚类,从而提高本地模型的个性化程度。

5. OCFL算法可以自然扩展到动态客户环境,其中单次聚类仅对客户子集执行。

研究方法

1. 计算客户梯度的余弦相似度。

2. 使用温度度量来检测联邦模型何时开始收敛。

3. 在早期阶段执行单次聚类,无需调整超参数。

4. 将OCFL算法与密度基聚类算法(如MeanShift和HDBSCAN)结合使用。

5. 评估聚类性能,包括RAND指数、调整互信息分数和完整性分数。

6. 评估本地性能和全局性能,包括F1分数和学习差距。

7. 分析温度函数的行为,以确定合适的聚类时刻。

实验结果

实验结果表明,OCFL算法在聚类性能和个人化方面优于现有的CFL算法,同时保持了可接受的泛化能力。OCFL算法可以有效地在早期阶段对客户进行聚类,从而提高本地模型的个性化程度。实验结果还表明,OCFL算法在动态客户环境中也能很好地工作。

未来工作

未来研究可以探索联邦聚类对隐私的影响,并研究如何在保持隐私保证的同时实现个性化。此外,还可以研究如何在动态客户环境中更有效地执行单次聚类。