写点什么

金融行业怎么用 AI?蚂蚁金服是这么做的

  • 2019-11-26
  • 本文字数:3775 字

    阅读完需:约 12 分钟

金融行业怎么用AI?蚂蚁金服是这么做的

伴随着金融科技的不断创新,人工智能技术已成为金融行业的重要驱动力。


在 9 月 27 日于杭州云栖小镇召开的云栖大会“金融智能”专场上,蚂蚁金服集团副总裁、AI 首席科学家、达摩院金融智能负责人漆远博士做了开场演讲,向与会嘉宾分享了金融智能方面的思考与实践。议题覆盖复杂网络、共享智能、知识图谱、深度图学习等多个核心技术领域,以及这些技术在蚂蚁金服的业务落地和实践,体现了以”人工智能+金融服务+普惠可持续”来打造“有深度有温度的金融科技”的理念。


以下为演讲的文字实录。


最新调查显示,全世界仍有超过 17 亿成人没有使用过银行服务,占世界总劳动力的 50%,并且,金融服务在不同地区存在巨大服务差异,尤其是低收入、女性、少数民族和经济不发达地区。由此可见,普惠金融仍然任重道远。


AI 是普惠金融的核心驱动力之一,这里将分享蚂蚁金服在发展金融智能过程中的实践与思考。


金融与 AI 两者是相辅相成的。AI 可以赋能普惠金融提升风控能力,提高效率,改善用户体验和减少信息不对称。而金融也为 AI 提供完美的场景,因为金融行业数字化程度最高,拥有全方位多场景的应用,同时 AI 可以对金融服务提供显著的改善效果,所以金融行业也更有动力去发展和应用 AI。

金融智能的机会与挑战

那么从金融行业的角度,目前对金融智能有哪些机会和挑战?我们总结,它主要集中在复杂动态网络、对抗性、人机协作、公平性、数据安全和隐私保护,以及不确定性几个方面。


首先是复杂动态网络,网络在金融服务里无所不在,不管是人和商家、商品间的网络,还是支付交易网络,再是社交网络,各种网络产生大量复杂的结构性数据,这些网络之间带有各种强网络效应,比如合作或竞争活动等,如何对它们进行建模后分析是非常有意思的挑战。


规模本身也是一个挑战,蚂蚁金服已经服务了上千万家的商户,全球十二亿用户,超过一百万服务和小程序,这背后有海量的数据和巨大的生态,我们需要考虑如何从这些海量并有噪音的数据里提取有效信息构建好的金融服务。


比如对贷款的套现欺诈,或者保险的带病投保,如何有效地利用机器学习分析海量的网络数据来防止欺诈行为是非常关键的。蚂蚁金服在这方面已经取得了一些成果,在 AAAI 2019 上发表论文:基于 Attention 及 LSTM 的 GeniePath 学习网络关键路径的重要性,在实际防骗保应用里达到 95%的准确率。



第二,对抗性是金融里非常关键的特点。每一笔交易都有可能是人和系统的对抗。对抗性与前面的大规模网络和实时处理需求结合起来,将会变成更大的挑战。比如在支付宝一个简单的扫码结账的操作里,需要多个流程节点,而人和商家之间的结账交易构成了一个非常大的关系网络,同时要得到近乎实时的返回结果。对此,对抗性的风险决策的时间需要控制在 100ms 以下。这绝对不是个容易的任务。


第三,人机协作问题,要想服务海量用户,可扩展是很基础的能力,而要实现可扩展,需要把操作链条中的人移除,实现自动化。但另一方面,为了防止灾难性风险或者系统性错误,金融系统中人工干预是不可或缺的。在这种混合式的人机系统里,我们需要解决机器预测和决策的可解释性,自动化算法可监测、可中断等等问题。


第四,算法的公平性。女性、少数族裔、低收入人群等弱势群体都应享有无偏见的金融服务。但标准化方法极易引发不自觉的偏见,完美的公平性和算法的准确性可能产生矛盾。随着机器智能在我们越来越多的系统里发挥着关键决策功能, 我们如何能够合理设计算法及其 Metrics 来预防和减少算法偏见,也是一个非常关键的研究方向。


第五,数据安全和隐私保护,在整个社会对数据和隐私保护越来越重视的大前提下,作为服务提供方希望能够打破数据孤岛,让更多的数据融合产生价值,同时保证数据安全隐私,这两者其实也是矛盾的,因此,我们要想办法应对这个挑战。


最后,还有金融风险的不确定性,现实中的一些黑天鹅事件会对金融造成非常大的影响。这些不确定性可能来自非线性自反馈或者隐含变量或者复杂动态网络。当前的机器学习缺乏好的工具来处理这些问题。我们看到一个好的方向是把经济学中的理论,比如博弈论和机制设计,与机器学习进行融合,推动对抗学习、基于机器学习的机制设计、多智能体系统,及因果分析等方面的进步。



当然,金融智能还有不少其他方向,这些方向既是挑战也是机会,每个方向往前走一步会推动技术发展和业界落地。

蚂蚁金服金融智能实践

蚂蚁金服致力于实现普惠金融,为全球的商户和消费者提供服务。



在过去几年里,我们构造了两个非常关键的学习能力,分别是蚂蚁图智能平台和蚂蚁共享智能平台。蚂蚁图智能平台支持百亿节点/万亿边的图数据推理和深度学习训练、毫秒级实时构图与查询能力;蚂蚁共享智能平台提供安全可信的数据共享和机器学习算法的跨机构联合建模能力,支持对百万级金融样本建模,秒级计算。


基于图智能技术,我们提升了企业风险刻画能力,帮助新增数百亿的贷款,其背后是从单点建模到网络化的升级,有效利用了海量的关系信息。另外一个关键词是共享智能,这是一种在多方参与且各数据提供方与平台方互不信任的场景下,能够聚合多方信息并保护参与方数据隐私的学习范式,详细的技术解读可以查看我们之前的技术文章《共享智能:蚂蚁金服数据孤岛解决方案》。我们已经在信贷业务里进行了实践。


另外,基于共享智能技术我们将风控能力赋能合作伙伴,联合数据建模提升模型性能,已经在外部银行落地联合放贷能力。我们希望将来能够联合更多的金融机构,使用共享智能更有效地提升双方风控能力,服务广大的客户。


这些实践应用的背后是多年的基础开发和经验积累,从 2015 年开始研发,我们有 50 多个专利在审,拿到了一系列相关奖项,并正在牵头制定国际 IEEE、国内以及行业等技术标准。我们有完整的软硬件结合的解决方案,既包括数据出域、在可信环境里共享智能,也包括数据不出域、模型在本地的共享智能,参与方可以非常灵活的选择不同模式共同提升风控能力。


前面的案例是用 AI 提升风控能力的,下面再介绍几个在提高效率,改善用户体验和减少信息不对称方面的落地案例。



首先是智能理赔,目的是通过人工智能能力来提升理赔效率。多收多保服务已经覆盖全国千万小商贩;相互宝已吸引 9 千万用户加入,去年新推出的老年版相互宝也在 9 天内突破 1000 万用户,真正让更多人享有保障。但是通过人工进行理赔由于单据多、流程复杂,相应的服务成本是非常大的挑战。如何提升服务效率,降低成本是智能理赔要解决的核心问题。在多收多保上,我们将它的核心能力总结为“212”:2 分钟报案,1 秒钟核赔,2 小时到账。



这里面的流程是,用户通过支付宝上传材料,我们基于金融级图像识别能力识别材料中的非结构化的文字、图章等信息,并结合 NLP 与健康知识图谱理解背后说什么,再抽取关键信息进行后续的校验和分析推理,从而进行智能理赔决策。



另一个案例是企业知识图谱。很多金融的风险来自于各方信息不对称,我们希望通过知识图谱来减少这种信息不对称。我们把非结构化的数据结构化,相关的数据通过相关的关联面联系起来,形成企业知识图谱,用来理解当前面临的重大风险,公司的风险指数,相关的风险级别等。



它的背后是一整个处理链条,比如这一段非结构化的自然语言的法律文本,我们把它给结构化,并把主体提取以后变成有效的知识图谱,就可以辅助分析和推理。



接下来讲用户体验的提升。对金融机构而言很重要的一点是客服体验,2016 年我们的用户大概是 4.5 亿,现在已经达到 12 亿,同时过去几年我们不断推出新的产品和服务,但客服人员并没有和用户数量及产品数量一样呈线性增长,核心的原因靠的是 AI。我们在 2015 年智能客服的自助率从 60%提升到了 94%,2016 年则是 97%,2017 年机器人服务平均质量超越了人工服务, 2018 年通过支付宝可以语音买票,今年云客服能力在钉钉服务了广大的客户,并助力菜鸟服务大量的物流公司,其背后即是借助人工智能改善用户体验。


最后讲一个非常有意思的事,是我们的同事在过去几个月志愿完成的一个小项目——“智能垃圾分类”。大家知道,正确分类是垃圾可回收处理的关键步骤。今年 7 月 1 号上海出台了垃圾分类政策。垃圾分类对回收垃圾减少碳排放是件大好事,但是对居民而言面对上千类垃圾如何正确分类不是件容易的事。于是蚂蚁 AI 几个算法同学和支付宝产品与运营同学一起组成了自愿攻坚小分队,基于我们已经有的图像、搜索、智能助理和知识图谱平台,快速开发 AI 垃圾分类,在两周后,就是 7 月 15 号,发布了 AI 垃圾分类小程序 。对于图像、语音、文本的准确率均达到了 90%以上,能够覆盖 2 万多种物品的识别与分类。上线一周后就达到了 400 万 DAU,3000 万的模型调用量。除了软件的小程序之外,我们还和生态合作伙伴研发出了“智能垃圾回收箱”的 IoT 硬件。


9 月 27 号,我们的同学在纽约参加了第 74 届联合国大会,现场宣讲蚂蚁金服智能垃圾分类解决方案,用 AI 技术践行联合国可持续发展目标(Sustainable Development Goals)。下一步,我们会和阿里云以及生态合作伙伴加强合作,将智能垃圾分类的技术开放出来,赋能整个垃圾处理产业,期待在 2025 年能帮助将中国的垃圾处理环节的碳排放降低 20%,这是我们的一个长期目标。


我们希望技术不仅仅有深度,也是有温度的,希望能够用人工智能来推进普惠可持续的金融服务。


本文转载自公众号蚂蚁金服科技(ID:Ant-Techfin)。


原文链接:


https://mp.weixin.qq.com/s/ZAqysZlKJz0MRJGp_dSg3Q


2019-11-26 14:581310

评论

发布
暂无评论
发现更多内容

腾讯的区块链为何败给了老干妈的“萝卜章”?

ToB行业头条

30岁+程序员职场攻略:找到自己的“职业锚”乘风破浪

华为云开发者联盟

程序员 AI 开发者 职场

6种快速统计代码执行时间的方法,真香!

王磊

Java

猿灯塔:spring Boot Starter开发及源码刨析(五)

猿灯塔

spring 猿灯塔

MySQL性能优化(二):选择优化的数据类型

xcbeyond

MySQL性能优化

MySQL性能优化(三):深入理解索引的这点事

xcbeyond

MySQL 索引 MySQL性能优化

面试官:如何决定使用 HashMap 还是 TreeMap?

爱嘤嘤嘤斯坦

Java 算法 hashmap

从0开始设计Flutter独立APP | 第三篇: 一劳永逸解决全局BuildContext问题

渔子长

flutter 大前端 跨平台 React

【面试题系列】——Java基础

Noneplus

Java

CAP原理

李白

实战技巧,Vue原来还可以这样写

前端有的玩

Java Vue 大前端 技巧

API接口设计最佳实践

Man

Java 安全开发 设计实践 APi设计 接口管理

Spring配置类深度剖析-总结篇(手绘流程图,可白嫖)

YourBatman

spring springboot @Configuration 白嫖

Malagu 框架开发 React 应用新体验

木香丘

Serverless 大前端 React 微应用 Malagu

“Python的单例模式有四种写法,你知道么?”——孔乙己

BigYoung

Python 设计模式 单例模式

【进收藏夹吃灰系列】——Java基础快速扫盲

Noneplus

Java

Doris 临时失效处理过程

石刻掌纹

一致性协议算法

张瑞浩

震惊!ConcurrentHashMap里面也有死循环,作者留下的“彩蛋”了解一下?

why技术

Java 源码 jdk 后端 bug

从需求到交付——论敏捷过程中的需求管理

华为云开发者联盟

敏捷开发 团队协作 需求管理 故事 持续交付

MySQL性能优化(一):MySQL架构与核心问题

xcbeyond

MySQL MySQL性能优化

计算机网络基础(二)---网络层-IP协议详解

书旅

php laravel 计算机网络 网络协议

doris临时故障恢复过程时序图

刘志刚

静态代码检查完成代码分析和SonarQuber的初探

陈磊@Criss

啃碎并发(11):内存模型之重排序

猿灯塔

昨天、今天、明天

escray

Malagu 框架的认证与授权【借鉴 Spring Security 和 aws iam 的设计】

木香丘

身份认证 权限系统

架构师训练营作业 -- Week 6

吴炳华

极客大学架构师训练营

为什么我们应该使用 Flutter?

环信

flutter

第六周总结

石刻掌纹

文档写作利器:Markdown

xcbeyond

markdown

金融行业怎么用AI?蚂蚁金服是这么做的_文化 & 方法_漆远_InfoQ精选文章