报告题目:联邦学习与个性化重采样技术
报告人:樊平毅,清华大学电子工程系教授
报告时间:2023年8月9日下午14:00-16:00
报告地点:73882必赢网页版D308
摘要:
联邦学习作为一种具有数据隔离训练和用户隐私保护机制的分布式学习架构,受到了学术界和工业界的广泛关注。然而,由于其数据驱动模型,联邦学习仍然面临着数据驱动学习模型的共同挑战,即多用户数据的异构性、不同设备的异构性和通信渠道的多样性以及多类别数据分布的不平衡和相关性等。在本报告中,我们将介绍一种新的个性化数据重采样技术。我们首先引入通用模型下的集中模式数据学习模型,并以此为基准,给出联邦机制下数据重采样模式的理论性能上限。基于理论极限,我们构建了一个个性化数据处理的优化问题,并利用信息论中的注水原理推导出最优重采样权重的显式表达式。然后利用数据库测试验证了理论方案的有效性,并给出了一些理论可解释性的系统设计原则。最后,我们总结并指出了这种新方法的潜在应用场景。
报告人简介:
樊平毅,清华大学电子工程系长聘教授,开源数据认知创新中心主任,1994 年在清华大学电子工程系获博士学位,1997-1999 年在香港科技大学和美国特拉华大学访问,多次到美国、欧洲、日本、香港和新加坡多所大学和研究所访问。承担国家 973、863、移动专项、重点研发计划,国家自然基金和国际合作项目。发表SCI论文 200 多篇(IEEE杂志140多篇),申请国家专利30多项,国际专利5项,学术著作4部。获 IEEE ICC2020、 Globecom2014 等 9个国际会议最佳论文奖,IEEE TAOS 2020 年度最佳论文奖,IEEE TWC (2009) 优秀杂志编委奖等,任 IEEE 和 MDPI 等多个杂志的编委,任 Open Journal of Mathematical Sciences 编委,中国信息论分会副主任,中国6G-ANA TG4合作主席,IEEE ChinaSIP 网络与通信技术委员会主席等。 近期的主要研究方向包括 6G 无线通信网络与机器学习、语义信息论与广义信息论,大数据处理理论以及智能网络与系统检测等。