人类正在步入一个以核心算法为重要生产要素的智能时代,人工智能技术的进步和创新已经成为社会经济发展的核心。作为新一轮产业变革的核心驱动力,人工智能将进一步释放历次科技革命和产业变革积蓄的巨大能量,创造新的强大引擎。
在人工智能赋能金融的浪潮中乘风破浪,当代青年争做领域“弄潮儿”。为此,“2022 深圳国际金融科技大赛( FinTechathon )—— 西丽湖金融科技大学生挑战赛”这场面向金融科技前沿领域、专为学生团队打造的世界级竞赛,便设置了人工智能赛道。
作为深圳市首届金融科技节中的重要一环,本届大赛由深圳市地方金融监督管理局、深圳市福田区人民政府、深圳市南山区人民政府担任战略指导单位,由深大微众金融科技学院、微众银行、深圳香蜜湖国际金融科技研究院主办。大赛为同学们准备了超过 69 万元的奖金池、联合深圳金融及科技类 10 余家企业提供 100 多张名企面试直通卡等重磅好礼。
为帮助同学们深入了解金融科技前沿成果,尽快熟悉和理解赛题赛制,9 月 28 日,本届大赛人工智能赛道的线上技术公开课上线。来自中国科学院计算技术研究所的陈益强老师、微众银行人工智能部服务智能室经理杨海军老师、微众银行人工智能部的高级算法工程师马国强老师围绕“人工智能”相关话题和赛题展开了主题分享。点击链接(https://www.infoq.cn/video/RrCRTejeMWrOBkGv75G8)可观看直播回放。
以下为本期公开课直播精华内容整理:
中国科学院计算技术研究所陈益强:“人工智能的前沿技术及应用分享”
人工智能竞赛推动着人工智能技术的发展。在图像领域,2010 年到 2017 年间每年举办一次的 Image Net 挑战赛完成了使用人工提取特征+机器学习到大规模应用深度神经网络再到广泛使用 ViT 进行图片分类的转变,分类准确率已提升到 90% 以上;在 NLP 领域,从使用词袋技术创建特征输入到机器学习分类器后使用 TF-IDF 微调,到词嵌入+神经网络的广泛使用,再到预训练模型和 TransFromer 架构的大量使用,NLP 系列挑战赛见证了 NLP 发展的历史进程,除此之外的其他大赛,例如 ACM MM Challenge 2022 中更是把视频和自然语言多模态结合在一起做研究,提供了美妆视频时域定位、美妆视频密集描述生成等赛题。
数字经济领域是未来中美竞争和国际竞争之间竞争的主战场,实现数字经济,就是把人工智能赋能到各个传统场景中,把人工智能中的一些在图像、语言、文本、视频中的方法和场景做结合,在结合过程中要考虑以下三个主流问题:
如何按照国务院定义的“原始数据不出域,数据可用不可见”的交易范式来推动 AI 的研究。这是一个具有挑战性的问题,也是现在的研究热点。
由于 AI 正越来越多地被用于直接影响到人类的福祉、生命或自由的“关键系统”,需要一种在满足监管标准或政策需求的情况下,既能帮助增强用户对 AI 系统的信心与信任,又能防止偏见促进算法公平的可解释的 AI。
发展囊括了可解释性、安全、隐私、计算等多个方面的可信 AI 已成为全球共识,是未来人工智能健康发展的必由之路。
挑战与机遇叠加,变局与新局并存,陈益强也带来了人工智能发展过程中的挑战和应对策略的分享:
第一,质量低的数据会影响联邦性能,针对数据质量统计问题,可以采用基于联邦共识的数据标签修正方案:利用共识机制,共享参与方置信度,从而计算联邦置信度,利用联邦置信度来实现标签噪声修正。
第二,常规的联邦学习方法会过度拟合本地数据,导致难以快速收敛;通用模型难以自适应个性化的本地数据分布,性能提升有限。针对模型个性化问题,可以采用类别自适应蒸馏的异构联邦学习方法,在分类损失和蒸馏损失之间做平衡。
第三,针对每个中心都建了一个联邦,但多联邦构建主体不一的情况,公共知识积累阶段+个性化阶段的多联邦协同方式较简单地加权平均在效果上提升显著。
第四,做到 AI 的可解释性,可以采用图神经网络。图网络关系对齐算法就能够把不同图的网络知识图谱在语意关系上进行对齐并表征,使用图神经网络可以更好地表达拓扑关联结构的数据。
最后,做到可信 AI ,可以从以模型为中心和以数据为中心两个方面考虑。以模型为中心时,在给定数据的基础上调整模型达到最优,例如使用决策树解释从根节点到叶节点产生标签的过程,使用类似 Garad-CAM 模型这种基于梯度的解释;以数据为中心时,主要考虑如何完善数据,例如在一站式的模型开发平台通过数据清洗、筛选、标注、增强等过程系统地改进数据。
微众银行人工智能部服务智能室经理杨海军:“微众银行场景下的 AI 解决方案”
需求引领技术,在 AI 技术的浪潮下,微众银行面向丰富的业务场景,提供了多种 AI 解决方案,实现了 AI 创新成果的快速落地。本次直播分享中,来自微众银行人工智能部的服务智能室经理杨海军老师带来了微众银行的场景化产品矩阵,在解决企业实际问题的同时,也为同学们带来了许多启迪。
首先,杨海军分享了在线智能文本客服、智能语音机器人等面向客户的智能产品,不论是在使用效率、使用成本、还是用户满意度上,它们都交出了一份满意的答卷。值得一提的是,由于 NLU 应用效果与具体业务场景非常相关,业界厂商提供的通用 AI 服务在大多实际业务开展中并没有很好的表现。比如业界通用语音识别引擎在微众银行业务中语音识别字准率在 70%左右,微众银行则通过自研语音识别引擎并在实际业务应用中进行优化,将语音识别字准率提升到了 96%。另外自研的语音合成引擎,针对业务场景进行了深度定制,支持音色、语调、音量等多种场景化设置,达到了不错的应用效果。
然后,杨海军又针对智能坐席助手、智能培训、智能质检等面向银行内部的智能产品做了分享。在智能坐席助手中,通过对坐席与用户的通话录音进行实时质检来规范坐席行为,系统中除了会实时显示用户画像信息外,还会通过根据标准流程对客服进行话术推荐来增加促成效率。而智能培训则可让管理员灵活安排培训任务,让坐席灵活安排时间进行在线培训,可实现智能化交互式培训流程,该系统降低了由于坐席频繁流动带来的培训成本,提高坐席培训的效率。
此外,杨海军还针对智能内容分析、智能营销、智能核身、智能双录、声纹识别、人脸识别、活体检测、多种 OCR 应用等进行了逐一介绍分享,这些技术已在微众实际业务中得到了大量应用,并在技术指标上普遍优于业界优秀厂商。
在最后,杨海军分享了将多个独立的产品联合应用在客服、营销、催收、运营等场景中的 AI 场景化解决方案。比如在客服场景中,用户通过智能文本客服或智能语音客服进行用户咨询或投诉,机器人对用户提问分析后进行回复,同时机器人可自行学习完善知识库;对于机器人无法解决的问题可转接到人工坐席,智能坐席助手对通话内容进行实时智能质检并提供优秀话术引导、流程提示等;此外对于流动性较大的坐席团队还可使用智能培训工具进行坐席培训。
微众银行人工智能部高级算法工程师马国强:“人工智能赛道参赛指南和联邦学习 FATE 的应用”
抓住了问题的关键,其他一切则会迎刃而解。为此,在 9 月 28 日直播的“2022 深圳国际金融科技大赛( FinTechathon )—— 西丽湖金融科技大学生挑战赛”人工智能赛道公开课中,微众银行人工智能部高级算法工程师马国强为同学们详细解读了“人工智能赛道参赛指南”和“FATE 联邦学习”。
本届大赛已于 9 月 19 日启动报名(报名官网:https://www.infoq.cn/zones/fintechathon/campus2022),以组队赛形式参赛,每个队伍 2-5 人,报名后由平台协助组队。人工智能赛道的赛题主要是基于 FATE 联邦学习平台,利用纵向和横向联邦学习去设计一些创新性的产品。初赛阶段主要关注 Demo 的可行性、完备性以及最终实现的可能性,12 月初的线下决赛评委会从产品最终完成度,产品完备性、创新度、商业化价值、路演情况这些方面对产品进行评判。
马国强对纵向联邦学习和横向联邦学习进行了详细介绍。关于纵向联邦学习的建模,其中各个参与者拥有的数据 ID 相同,数据特征不同(有的参与者可能没有标签):
纵向联邦学习中的一些经典协议:
同态加密:数据在密文状态下运算的结果解密后等价于明文运算下的结果;
MPC-SecretSharing:各数据持有方将数据随机拆分成 N 份后分发给各方,各方只有该数据的一个随机切分部分,最终通过协议可以重构还原计算结果;
不经意传输:A 持有多条消息 m1,m2…mn,B 希望获取其中的一条 mk,但 B 不希望 A 知道获取了 mk,A 不希望 B 获取除了 mk 之外的其他消息。
下面介绍几种纵向联邦中的常用算法:
基于隐私保护的样本 ID 匹配。FATE 中提供了 RSA+ 哈希机制的安全求交和基于椭圆曲线的 DH 安全求交两种解决方案;
逻辑回归。FATE 提供基于同态加密和 Secret-Sharing 混合协议的纵向联邦逻辑回归;
SecureBoost 算法。结合 XGBoost 算法原理及同态加密的协议,在多方数据不出域的情况下去完成梯度直方图的计算,从而构建梯度提升树模型,效果安全无损。
与纵向联邦学习不同的是,横向联邦学习的建模,其中各个参与者拥有的数据特征相同(包括数据标签),数据 indices/ID 不同:
企业将联邦学习在实际业务应用中取得了傲人的成绩。比如,某新闻平台联合多方数据建立联邦推荐模型,在 PV、停留时长、CTR 方面都有显著提升。
又如,某企业通过联邦智能数据合作协同中台,服务某集团内客户资源管理与协同共享。集团内不同业务子公司之间进行大数据合作,准确地分析集团现有客户,更有效地利用集团内部客户资源发挥不同业务板块的数据价值,通过联邦建模建设更有力的推荐服务,从而实现精准的交叉营销。
再如,某通信企业异构平台互联互通。采用轻量化中间件模式,分别基于数据、状态、结果的消息队列技术进行了组件化改造,以最小改动来满足“低耦合、可复制、易扩展”的异构互通需求,利用中间件实现的任务事件转发,贯穿隐私计算任务的各个交互阶段。基于中间件的互通方式,可将对各平台原生框架的改动量降到最小,便于对不同隐私计算平台的扩展对接,具备较好的通用性与灵活性。
工欲善其事,必先利其器,一件称心顺手的工具往往能带来意想不到的效果。 作为本届大赛人工智能赛道的指定开发平台,FATE 是全球首个工业级联邦学习开源框架,FATE 也是国内最大的联邦学习开源社区。FATE 是目前最具权威和价值的联邦学习开源技术框架,成为很多公司的联邦学习产品技术框架,中国信通院调研统计显示,55% 的国内隐私计算产品是基于或者参考开源框架,其中以 FATE 开源项目为主。
本届大赛官网中的人工智能学习园区(https://www.infoq.cn/zones/fintechathon/campus2022/support/ai)也提供了很多 FATE 教学视频供同学们参考。FATE 支持 AlllnOne 集群版部署、单机版部署,以及 K8s 部署等多种方式,本次比赛不对使用的 FATE 版本做任何限制,同学们可按需使用。
同时同学们在开发上层系统的时候可能会用到 FATE 提供的 RestAPI 或 python SDK 去进行系统对接。此外,马国强还向同学们推荐了一个比较好用的工具—— FATE-Pipeline 客户端,它是和 Keras 类似的用户建模编程界面,接口比较简单,写一个“联邦建模流程”和“神经网络联邦模型”是很简单的,它可以无缝对接 Keras 与 pytorch, 风格保持一致,欢迎大家去使用。
同学们关心的其他问题
Q:智能语音机器人在研发过程中有什么难点?
A:智能语音机器人是人工智能技术很多技术模块的集成,包括 ASR、TTS 以及语义理解。在 ASR 部分,我们一开始使用友商后来自研。自研 ASR 的过程中,数据采买和数据标注部分对数据的要求非常高。在 NLU 部分,实现一个比较容易配置的多轮对话的对话树,需要对对话树的每一个节点做语义意图的理解,标注很多数据和一个非常庞大的数据池。此外,在与数据中心、呼叫中心互联的部分,不同的通讯协议会影响交互延时,需要不断进行调优。难度还是比较高的。
Q:有没有学习方面的书籍推荐?
A:针对初学者,推荐购买一些偏向实践类的书,先去做一些真正的题或者下载一些开源的题去实际运行,针对运行过程中的疑惑,去阅读一些当前技术点相关的理论知识,这样一来,接触的会更快些。可以去网上购买一些人工智能、深度学习相关的手把手或者实践类的书籍;针对有更深需求的人,可以下载一些论文,了解一些比较好比较新的技术后再去尝试。
Q:人工智能赛道提供相关数据吗?纵向联邦的数据集去哪里找?
A:本届人工智能赛道不提供数据,需要大家自行寻找机器学习的数据并做切分,也可以去找一些业界标准的数据集来使用。本次大赛不提供数据集,也不限制大家的场景,需要靠大家自己去发挥创造力。
Q:比赛过程中面临的一些个性化解决问题时如何使用联邦数据?
A:数据集的切分和实际使用息息相关,每个人面临的场景不同,需要更加熟悉现实中的场景,只有真正了解该场景,创造的数据才有一些现实意义。同时要注意问题解决思路的可持续性和延展性,让它在后续可以进行一些持续开发、完善和推广。
评论