2019年10月26日,中国计算机学会(CCF)在中国科学院计算技术研究所举行了主题为“AI联邦学习的最新应用落地”的研讨会,现场来自腾讯、华为、微众、平安等联邦学习头部企业的代表,展示了新一代联邦学习技术在各行各业的应用范例。
在大会现场,InfoQ记者有幸采访到了微众银行人工智能首席科学家范力欣博士,他为读者深入解答了有关联邦学习的前沿技术及行业应用问题。
在研讨会开场致辞中,微众银行首席人工智能官杨强教授提出,联邦学习的发展需要经历三个阶段,即“点到点的联邦学习发展阶段”,“应用落地、积累案例阶段”与“联邦学习价值联盟网络建立阶段”。在经历第一阶段的发展之后,目前的联邦学习正在积累应用落地经验的阶段。
随后,本次研讨会主席、微众银行人工智能首席科学家范力欣在《从数据孤岛到隐私保护:联邦学习对各行业 AI 落地之影响》报告中回顾了联邦学习被提出的历史背景,进一步阐述联邦学习落地的必要性。
微众银行人工智能首席科学家范力欣
范力欣博士表示:如今我们正在经历互联网的第四次信息革命,坐拥海量的信息与数据。“对这些数据利用人工智能进行解读和整合,将对我们生活的方方面面产生深远的影响。”为了挖掘海量信息背后的知识,让所有的数据以安全合规的方式进行 AI 建模,联邦学习正是应运而生。联邦学习这一新兴的 AI 技术已经相继落地于各行各业,在智慧城市、智慧终端、智慧医疗等领域都取得了突出的成果。
分享结束后,范力欣博士回答了 InfoQ 记者关于联邦学习的提问。
为什么需要联邦学习?
在范力欣博士看来,联邦学习的发展概括起来就是一个“快”字,影响也是逐渐被大家认同和接受。他说:“2018 年初,杨强教授开始领导微众银行人工智能部,两年不到的时间,联邦学习已经快速的发展了起来,而且在业界也得到回应,京东、腾讯云、平安科技等等企业也已经加入到联邦学习的队伍中来。”
至于原因,范力欣博士认为,首先是因为行业有痛点、有业务上的需求,尤其在业务应用落地的时候确实遇到了一些问题:比如隐私保护、安全合规等等;另外,这些数据在不同企业中,出于监管要求或者企业自身的考虑,是一个个被隔离如孤岛般的存在,而不能充分挖掘数据背后的知识和价值。
范力欣博士说:“所以我们是希望在这个数据分隔的情况下,利用联邦学习把数据背后的知识和价值整合起来”。
发展联邦学习面临哪些挑战?
范力欣博士坦言:在推广联邦学习的过程中,建立一致的标准是目前面临的一大挑战。
首先,从隐私方面来说,虽然各个国家对待隐私保护的问题都很重视,但是中国有自己的隐私保护法,美国法律又有不同的要求,欧洲的 GDPR 更是以严格著称,如何让一套标准能够在所有国家都通行,是非常困难的。“这是一个求同存异的过程。”范力欣博士说道。
其次,市场的认知仍然有待培养。范力欣博士说:“先行者们在努力布局,包括培养市场、沟通客户,很多时候并不是技术水平无法达到,而是建立信任需要花时间。”
“也正因如此,”范力欣博士补充说:“我们需要一些安全的验证,需要一个共同的标准,我们也正在致力于推进这个标准。”
推进联邦学习 IEEE 标准意义何在?
这个标准是什么?答案就是:联邦学习 IEEE 标准。
IEEE,全称 Institute of Electrical and Electronics Engineers,即国际电气与电子工程师协会,是目前全球最大的非营利性专业技术学会。IEEE 下设的标准协会是世界领先的标准制定机构,其标准制定内容涵盖人工智能等前沿信息科技,以及通信、电力和能源等多个科技领域,对全球科技发展具有举足轻重的影响。
如果能够推出联邦学习 IEEE 标准,其影响力将会带动整个行业地发展。 范力欣博士表示,推行联邦学习 IEEE 标准,本质上是为了方便行业协作。他说,技术的进步就是为了优化社会的运作,提升生产率,以达到提供更好服务和提升生活质量的目的,这是非常有意义的。
在联邦学习 IEEE 标准的制定过程中,自然少不了中国科学家的身影。就在近期,IEEE P3652.1(联邦学习基础架构与应用)标准工作组第四次会议于北京成功召开。北京大学、IEEE、微众银行、创新工场、京东、中国电信、腾讯、小米、阿里巴巴、依图、星云 Clustar、第四范式、华为终端、VMWare、LogiOcean、SensesGlobal、Swiss Re、Intel、CETC BigData、蚂蚁金服、华夏基金、富数科技共 22 家头部企业与研究机构参与,会议聚焦于联邦学习的场景分类与需求分类,着重对联邦学习的安全测评与评级进行规划,进一步探讨联邦学习标准制定。
范力欣博士说:“这是一个奠基性的贡献。”
联邦学习如何助力人工智能落地进程?
人工智能发展到今天,面临的最大挑战就是落地问题,这也是近两年不少企业和机构努力的方向。联邦学习正是为了解决落地难而生的。 AI 发展的三要素是“数据、算法、算力”,而联邦学习能够解决数据孤岛问题。那么,这两者之间有什么联系呢?
范力欣博士认为,AI 落地难存在着几个方面的原因:
一方面,大众对人工智能技术的期望过高。他表示,现在流行的机器学习本质上还是概率学习,并不能一夜之间解决全部问题,或者完全模拟人类的智能;
另一个就是数据问题。巧妇难为无米之炊,数据如果被割裂开,就无法被有效地利用起来,也无法发挥它的价值。所以范力欣博士希望,联邦学习能够起到桥梁的作用,把这部分空档连接起来,把数据背后的知识连接起来。
因此,联邦学习解决的不仅是数据问题,更是 AI 落地的关键问题。
以医疗数据为例,首先患者在医院的数据是高度敏感和受严格保护的;与此同时,防疫局方面也有相应的数据,如果能把两方面数据背后的知识整合起来,就能够知道医院这些病患数据背后的趋势是怎样的,是否有疫情隐患存在,对于医院、防疫局的工作都是有帮助的。
范力欣博士说:“知识层面的扩展,不仅仅是推动商业进步,而且是社会进步的基础”。由于法规和技术的原因,现在各行各业的数据并没有被充分地利用起来。因此,联邦学习的发展是很有必要的,它的及时出现就是为了解决 AI 落地的最后一公里问题。
采访嘉宾简介
范力欣博士,微众银行人工智能首席科学家, 曾任诺基亚技术公司首席科学家,研究领域包括机器学习和深度学习,计算机视觉和模式识别,图像和视频处理等领域。他是 60 多篇国际期刊和会议出版物的作者,共获得 6 千多次的引用。范博士也是美国,欧洲和中国提交的近百项专利的发明人。
评论