摘要:针对现有的基于内容的个性化推荐系统中面临的数据异质性、隐私保护、快速通信和可拓展性挑战,这项工作提出了名为FTMAB (Federated Two Multi-Armed Bandit)的联邦学习算法。该算法利用联邦学习框架实现隐私保护,通过多臂赌博机技术对本地模型进行全局聚合处理数据异质性,该架构在服务器端采用置信区间上界方法进行全局臂筛选推荐,并通过动态客户端采样策略优化通信,在本地客户端聚合用户效用评分加强推荐的个性化。理论分析证明FTMAB的遗憾上界为O(log T)。在合成数据集及真实数据集上的实验表明,相较于现存方法,FTMAB在显著降低通信成本和运行时间的同时,保持了较低的遗憾值。FTMAB框架有效平衡了隐私保护、推荐质量与通信效率,为解决个性化推荐中的数据异质性和可扩展性问题提供了高效方案。