写点什么

攻与防之战,AI 风控如何“智”斗金融黑产

2020 年 9 月 26 日

攻与防之战,AI风控如何“智”斗金融黑产

成为金融行业的核心竞争力。


AI 风控是金融数字化最有价值的应用场景


AI 风控目前是金融数字化最主要的应用场景。根据艾瑞咨询《2020 年中国 AI+金融行业发展研究报告》,AI 风控约占到了 2019 年 AI 金融市场规模的 45%。AI 技术与风控的结合也被银行等金融机构视为最有价值的技术落地场景。


随着业务的数字化、线上化进程不断加快,基于传统的业务拓展模式所发展起来的传统风控方式和管控手段已不能适应业务创新的需要,金融机构业务在线上化的过程中可能会面临虚假申请、伪冒交易、内容违规等风险,面对这些新业务存在的风险,传统金融机构之前所积累的经验是否仍旧有效使存在挑战的。因此,金融业需要与时俱进引进新的技术,以弥补风控体系中的不足。


风险管控是金融企业的核心能力,最近几年,银行业对风控技术的投入不断增加,有不少金融机构选择和第三方智能风控公司合作构建智能风控体系和平台。


其实现在 AI 技术在金融行业风控上面的运用已远远走在了合规管理运用的前面,主要在银行业和互联网金融业的信贷、反洗钱等场景。机器学习、深度学习、自然语言处理、计算机视觉、知识图谱、语音识别等 AI 技术在风控领域都有广泛应用。


领域内部已形成了一套成熟有效的评估标准来评估风控效果,例如对建模的效果主要的评估指标是召回率和准确率。召回率用来识别和评估有多少未发现的黑产账户。准确率评估风控系统判断的准确度,有没有误伤普通用户。这两个指标相互对立、相互制衡,当需要更多召回时,可设置更多门槛,用更多特征将模型的预测调到更低,采用更严格的策略,这时召回率提升,但可能对用户伤害较大。反之,如果想尽可能方便正常用户,就要改变召回率。


值得注意的是,AI 风控的整体目标并不是说要把每一笔欺诈交易、每一个“坏人”全部找出来,这很难也并不现实。风控的最终目标是,即便在任何最恶劣的情况下,仍然能够对全局的风险做到有效控制。


面临多重技术挑战


现阶段,AI 风控技术在发展和业务应用的过程中一直以来都存在着挑战,主要体现在以下几个方面:


  • 信息壁垒


在传统企业中,特别是在一些大型的企业中,系统之间存在着信息壁垒。


  • 数据隐私问题


金融领域的数据对用户隐私要求较高,去年年底,多家金融大数据公司接连被查,数据安全问题也再一次引发人们的担忧。


“当手上的信息越多,模型识别的就越准,但风控会与个人隐私保护相冲突,因此既能在保护个人隐私的同时还能做好风控,这是一个非常大的挑战”,数美科技 CTO 冯堃告诉 InfoQ。据他介绍,针对数据隐私,数美科技目前采用两种解决方案,一种是业内大规模普遍使用的方法 — 对数据进行脱敏处理;团队也正在探索采用联邦学习技术。


维择科技首席咨询官孙睿在接受 InfoQ 采访时表示,法规层面上要求合规经营,首先需要思考的是,开展风控业务是否一定要涉及隐私,涉及过程中是否遵循了法规。先要弄清楚在法规的框架下能做什么和不能做什么,至于采用什么技术,则是第二步需要考虑的问题。


他坦言,尽管金融领域出现了不少隐私保护技术,但目前来看还没有特别好的、广泛认可或使用的解决方案。专门用于处理建模过程中隐私数据共享问题的联邦学习技术最近很火,但该技术尚没实现大规模落地。


  • 数据孤岛


数据孤岛的问题一直都存在,未来的一段时间也还会长期存在,市面上还没有看到特别好的解决方案出现。


  • 依赖大量标注数据


数据标注是深度学习和 AI 这几年发展的必然趋势,当“投喂”的数据越多,效果越好,这也是 AI 行业最主流的提升效果的方法之一。而这导致的后果就是,所有行业对数据标注的依赖度越来越高。


为解决这一痛点,InfoQ 接触到的两家公司采用了类似的方案。维择科技会使用一些无监督机器学习模型处理这些问题,其无监督机器学习算法能够有效发现已知和未知的欺诈形态,在协同的团伙型欺诈攻击案件中表现不俗,能在大规模攻击发生前及时拦截,并提供高可解释性的检测归因。为了达到更好的效果,孙睿建议将有监督与无监督组合使用会取得更理想的效果。除采用无监督学习技术外,数美科技也在尝试小样本学习等方法。


  • 依赖专家经验


传统的风控系统对于专家经验非常依赖,应用上 AI 技术后的智能风控体系,在一定程度上缓解了这个问题。


这里需要明确的是,AI 与专家经验之间的关系并不是非此即彼的。AI 是帮助专家将风控理念落地的工具,而非替代专家。当风险因素、规则特征繁多,专家经验管理起来力有不逮时,AI 能帮专家从繁复的规则中脱身出来。而在判断风险点何时何地出现上,专家经验又不可或缺。


因此,一个公认的解决方案是,要将专家经验和模型结合起来,二者同时存在,相辅相成,功能互补,互相配合。梁堃觉得,对于大多数金融机构而言,从零搭建起自己的风控系统,现在还做不到一下子完全替换掉专家经验,短期来看,至少在未来 3-5 年内不会出现这种情况。


  • 效率问题


机器学习中的模型训练在过去几年比较火,大家认为做算法、做模型能够解决很多问题。但后来发现还存在效率问题,多次的模型训练会耗时费力。


  • 实现风控的体系化


在搭建风控体系过程中,绝不是单靠一个模型、一个单点就可以识别的,否则很难达到真正抵达风险核心、控制全局风险的效果。想要建立一个体系化的风控系统是比较难的,上来的第一个挑战便是如何规划这个体系。


  • 风控的可解释性


当运营的技术越来越复杂,用到的程序越来越多时,风控的可解释性就是一大挑战,因为当判断一笔交易有风险时需要给出解释。那么,对现有的模型如何在做到复杂度的同时做到比较好的解释性是比较难的。


AI 能为“降本增效”做出 30%以上贡献


近年来,传统金融机构的获客成本不断提高,另一方面,黑产分子欺诈的手段也是“道高一尺、魔高一丈”,人机对话、网络诈骗等新兴欺诈手段增多,诈骗方法也渐趋智能化。


黑产的存在令金融机构营销的效果大打折扣,与传统的渠道买流量方式相比,线上营销最终触达的是 C 端用户,如果这些用户是黑产用来套利的假用户,那么将存在损失无法追溯的问题。


以前,银行对于营销活动的损失没多大概念,即便用户流失低于预期,也很难判别到底有多少营销费用到了真正的用户手里,有多少被黑产套走了。针对新型诈骗方法,AI 风控产品能帮助金融机构实现风控效果、降低获客成本、以及提升运营效率之间的平衡。


梁堃向 InfoQ 列举了 2 个典型案例。


  • 某 A 银行客户,为拉新用户投入一笔可观的营销费用,费用每天大概在百万元左右。数美科技的风控产品通过检测后发现,平均每天有 3%-5%的营销费用被黑产套走,是一笔不小的损失。

  • 某 B 客户在营销活动上线后两周,提现系统的拒绝率竟出人意料地达到了 90%。“当时我自己也挺害怕的,我在想是不是系统出问题了,怎么会一下拒绝这么多”。后来经过调查发现,其实 90%被拒绝的用户基本上都是黑产。


从降本增效的角度考虑,AI 技术的应用确实可以起到一定的作用。首先在降低获客成本上,如在贷款场景中,客户提交申请到审批的过程中,如需引入外部数据,每调用一次都会产生成本。用 AI 技术可以做到更精准、更高效的使用这些有成本的环境,这样就能降低获客成本。


在“增效”方面,同样以审批环节为例子,传统银行体系需要人工审核,审核人员通常需要看申请表、征信报告、外部数据等很多材料。如果利用图谱技术将这些信息整合到一个页面且以图像化的形式展示出来,把存在的疑点高亮出来提示调查人员,就能减少人工去不同系统调用数据的时间,提高处理效率。


根据孙睿的经验判断,AI 风控能够至少能够在成本和效率方面有 30% 以上的贡献。


孙睿认为,银行等金融机构搭建和落地智能风控体系需要具备四大核心能力:


  • 数据的质量和数据的有效打通


这是风控解决方案要想顺利落地第一个要解决的关键问题。金融行业各个企业数据质量参照不齐,传统风控流程中多是金融数据或交易数据,而“数据打通”不仅要求金融数据和交易数据,还要包括行为数据、实时产生的数据等,需要具备处理非结构化数据的能力。解决这个问题更多靠企业自发推动,但如何在保证业务发展的同时,把以往的这些历史包袱解决掉,对企业来说,挑战和难点重重。


  • 具备底层技术研发能力


为了适应业务创新,底层架构必须具备支持高并发,大量短时内请求的能力。


  • 建适应数字化转型体系


在数字化、智能化转型过程中,如何在原有的风控体系上搭建一些适应数字化或智能化转型的体系,这些同样也是为了支持业务创新的需要。


  • 专业人才配比


搭建整个智能风控体系需要专业运维人才,因为风控是动态的,不是静态的,不是搭建完成后就万事大吉了,而是需要有专业的人才去运用这套体系,不断完善和查漏补缺,以应对新风险的出现。在技术落地的过程中,需要企业或项目团队有相当的技术人员配比,如果缺少技术人员将会在落地过程中遇到一些挑战。


AI 风控解决方案在金融领域的实际应用过程中,经常遇到的一个难点是,解决方案应该采用哪种方式落地。一些新的技术,很多时候更倾向于云端部署,但很多企业出于自身运营模式、企业流程规定的考虑,要求本地化部署。在本地化部署的过程中,新技术要适应原有机器的性能、原有软件的版本,就有可能出现各式各样的问题,因此,在项目落地的过程中会存在很多理论上考虑不到的情况。


“AI 风控产品落地的过程中,最大的挑战还是大家的意识”,冯堃表示。与四、五年前相比,现在传统的金融机构对于布局 AI 风控的意识提高了很多。


不过有时候客户的期望与实际达到的效果之间仍存在鸿沟,一些客户对 AI 技术赋能期望过高。这是因为对技术的理解不够全面导致的,AI 技术应用到实际操作中后会受到多种因素影响,并非是技术本身不行。因此,在风控意识提高的同时,提高对技术全方位的认知也很有必要。


AI 风控是刚需吗?


自去年 9 月以来,监管机构加大了对金融机构的合规检查力度,监管重点多聚焦于数据的合规使用上,以往很多人都偏重大数据产品,大量收集用户数据,或多或少都会涉及隐私和敏感问题,数据合规压力很大。


在政策趋严之下,金融行业兴起一股技术回归的浪潮,各金融机构愈发重视风控环节中的 AI 技术能力建设。以往大家过度依赖数据,忽略了 AI 技术的深度使用,现在随着监管监管对数据合规使用的要求加强,有利于 AI 技术本身发挥更多价值。其实 AI 风控产品/平台也有利于帮助金融机构减轻一些来自监管层面的风险和压力,例如,控制信用卡的资金流向。当然,AI 风控产品是在遵循合规要求的前提下设计的。


不能忽视的是,有些时候,尽管已经施加了最高等级的风险防控手段,但还是难免会出现一些泄密的情况,前文中也已提到了现阶段 AI 风控在技术和落地上所面临的种种难点,例如,人们担心 AI 对于数据的依赖会影响风控效果,也有人担忧,如果 AI 技术出现失控情形,是否会影响金融服务质量。


业内有一种声音质疑,AI 风控是否是一个伪命题?针对这一问题,InfoQ 询问了两位专家的看法。


“其实它已不仅仅是一个方式(工具),它会像在线业务的基础设施一般,就如同在线业务离不开数据库、云主机一样,未来在线业务也是离不开风控的”,梁堃对 AI 风控的前景表示非常有信心,他认为,AI 风控一定能够成为刚需。


孙睿亦认为,AI 风控是刚需,AI 能够解决一些传统银行体系中存在的痛点问题。首先是人工效率的问题,传统体系中,人为干预因素较多,但每个人工作时间有上限。但 AI 的工作时间不会受到限制,可以 24 小时工作。其次,AI 技术对细化客户分层的颗粒度及实现精细化管理助力颇多。以往做客户分层、客户画像是基于经验,基于历史客户表现做的风控策略,这些因为受限于人处理事件本身的限制,分层相对有限,客户画像的颗粒度比较粗,达不到精细化的管理要求。AI 能够代替人工处理,能精准用户画像,提高风险识别能力。特别是处理大规模的客户方面,很多国内的银行都是百万级、千万级、上亿的客户,如此大量的客户不能完全靠一个风控团队去处理,必须要借助 AI 技术进行这种大量级客户的风险识别工作。


值得注意的是,AI 风控对于传统银行业的革新并不是“根本性”的变化,“根本性”是要推倒重来,而在传统银行的体系下,不可能推倒重来,现有的 AI 技术也不可能完全替代原有的东西。因为系统存在老旧的状况,很多新的技术不会被积极利用,加上银行业务求稳以及政策监管等因素,当技术部门提出一些创新想法的时候,银行会更多地考虑如何保证现有系统正常运行不出现差错。因此,用“AI 赋能”来形容 AI 在风控领域所起到的作用更为恰当。


对于接下来,AI 金融风控领域的技术和应用的发展趋势,孙睿判断,未来 3-5 年,机器学习、自然语言处理以及知识图谱等核心技术会有更多场景的落地,他个人比较看好知识图谱的应用。知识图谱是实现人工智能的基石,相对于其他技术的落地,对知识图谱的开垦不是那么多,因此应该会迎来一个高峰期。现在可以看到很多金融机构,特别是银行,在应用了其他技术之后,也开始考虑知识图谱的落地。知识图谱在风控领域的应用很有前景,在贷前、贷中、贷后这三个环节都可以用到,帮助提高风险识别的能力和效率。


梁堃认为,从应用上看,AI 风控会伴随着金融领域业务在线化的进程,深入到各个领域里去,不断扩展、渗透到每个行业中去,除金融之外,还包括,电商、游戏、医疗、出行等行业。


采访嘉宾介绍:


梁堃,数美科技联合创始人 &CTO ,北京大学计算机硕士,国内知名机器学习与数据挖掘专家。曾任百度、小米,高级工程师、架构师,拥有多年机器学习和人工智能领域经验。


孙睿,维择科技 CCO(首席咨询官):拥有 15 年中外资银行风险管理实战经验,国内信用卡行业早期从业者,曾服务于中国建设银行、交通银行、汇丰银行。在银行业务风控领域有着丰富经验,擅长于零售信贷业务的反欺诈侦测及调查、风险策略制定、风险监控体系建设等方面。近年来,参与和主导了多个风控系统开发和升级项目,推动银行数字化建设和互联网转型。


2020 年 9 月 26 日 16:331574
用户头像
刘燕 InfoQ记者

发布了 484 篇内容, 共 150.7 次阅读, 收获喜欢 872 次。

关注

评论

发布
暂无评论
发现更多内容

旷工三天被开除,公司赔偿十万五 | 法庭上的CTO(9)

赵新龙

CTO 法庭上的CTO

从零开始学习Java8 Stream,看这篇就够了

Silently9527

Java stream java8

Prometheus TSDB(Part 2):预写日志(WAL)和检查点

_why先生

云原生 Prometheus tsdb 可观察性

JVM从概述到调优图文详解,含思维脑图深度剖析!

Java架构师迁哥

架构之书:雄伟与《Domain Driven Design》

lidaobing

架构 领域驱动设计

生产环境全链路压测建设历程之十 淘宝网2013年的建设过程

数列科技杨德华

硬核编程:30天=一个网站+一份周刊

老魚

程序员 建站 web全栈

DeFi(去)中心化DAPP系统软件开发

开發I852946OIIO

系统开发

期权代持的“坑”里,加拿大人也在 | 法庭上的CTO(11)

赵新龙

CTO 法庭上的CTO

Spring Boot 集成 Redis

噜噜猫

Spring Boot

1428万的Adobe采购纠纷 | 法庭上的CTO(10)

赵新龙

CTO 法庭上的CTO

数据类型第2篇「字典和集合的原理和应用」

清菡

测试开发

架构师训练营W09作业

Geek_f06ede

Canvas入门实战之用javascript面向对象实现一个图形验证码

徐小夕

Java 前端 canvas

盘点2020 | 30岁了,我终于入门编程了

希望

盘点2020

Java并发编程:多线程如何实现阻塞与唤醒

码农架构

Java并发

通过Postman和coding.net发布API

太极程序员

Postman API

【经验分享】RTC技术系列之音频编解码

邵帅

SPI 在 Dubbo中 的应用

vivo互联网技术

Java jdk dubbo spi

码了2000多行代码就是为了讲清楚TLS握手流程(续)

新世界杂货铺

golang https

甲方日常 68

句子

工作 随笔杂谈 日常

架构作业--大数据

Nick~毓

【小菜学网络】数据链路层概述

fasionchan

网络编程 计算机网络 网络协议 TCP/IP

量化交易APP系统软件开发(现成)

开發I852946OIIO

系统开发

DolphinDB与MongoDB在时序数据上的对比测试

DolphinDB

mongodb 分布式系统 时序数据库 DolphinDB 数据库开发

架构师训练营 Week8 - 课后作业

极客大学架构师训练营

anyRTC实时音视频-社交娱乐解决方案

anyRTC开发者

ios android 音视频 WebRTC RTC

如何快速打造一款钉钉 Go sdk

Ceelog

go golang 钉钉 企业微信

在线医疗的发展和优势

anyRTC开发者

android 音视频 WebRTC RTC 医疗方案

LeetCode题解:127. 单词接龙,BFS+统计单词变化次数,JavaScript,详细注释

Lee Chen

算法 LeetCode 前端进阶训练营

智慧社区系统开发方案,智慧平安小区综合管理系统建设

WX13823153201

智慧社区系统开发

NLP领域的2020年大事记及2021展望

NLP领域的2020年大事记及2021展望

攻与防之战,AI风控如何“智”斗金融黑产-InfoQ