天盾风控系统简介
天盾是保障京东商城及金融主要业务安全运行的风控系统,已接入业务场景达 200 多个,主要接入场景类型如下:
授信安全
支付业务
营销系统
账户安全
支持各种验证方式
1、天盾风控系统架构
接入的业务系统调用天盾时,天盾实时获取指标,指标通过指标加工系统生成,系统根据指标实时计算风险结果,返回上游系统。
2、天盾内部系统:
设备指纹
针对京东 PC 及 H5 页面采集设备信息报送天盾。
食蚁兽系统
食蚁兽系统是风控实时统计平台,适用于各种流式计算,可进行高密集,多维度,可伸缩,配置灵活的复杂计算的统一平台。
天盾引擎
天盾风控实时计算引擎,实时收集计算指标,并根据指标执行规则和模型,生成实时风险结果返回上游系统 。
天盾系统历史版本
1、天盾 1.0 系统
前身为京东白条风控,2015 年初上线,主要覆盖 10+种业务场景。使用 Groovy 语言,原子规则,规则包,试用设备指纹。
规则决策关系
原子规则:原子规则是最小粒度的规则单位,是基本指标计算。
规则包(决策):不同原子规则的组合,根据规则包(决策)的命中情况返回上游结果。
内部结构
上游系统调用天盾引擎后,引擎获取该业务的规则包,并解析规则,并行运行原子规则,最终获取结果返回收银台。
2、天盾 2.0 系统
2.0 系统特点:
规则改用 java 语言,2015 年底试运行,2016 年初上线
加入维度概念,所有规则都被放在固定的维度中,所有决策围绕维度进行配置
接入京东金融多种支付方式;多种不同订单业务;近 200 个业务场景
全场景使用设备指纹
加入食蚁兽
入模型,模型与规则并行
密码支付,指纹支付,无密支付,短信支付
规则决策关系
2.0 系统添加了维度的概念,规则脚本是原子规则的组合,通过维度与得分来表示一个规则脚本。
决策是维度得分的组合,其实就是脚本的组合,根据决策的命中结果返回上游系统。
天盾 2.0 内部结构
3、天盾 2.0 系统存在问题
维度问题:系统中的维度未起到实质性作用,无谓消耗了系统运行时间并增加了配置复杂度
原子规则配置混乱:针对重复性原子规则,不同场景参数要重新配置,参数配置问题查找困难,原子规则重用配置性比较差
随着规则的不断增多,系统运行时间不断增加,难以达到业务的需求,急需设计新系统,提高系统的性能,降低系统响应时间
2.0 系统性能问题
随着规则的不断增加,主要交易场景性能已经无法满足业务需求
往年大促前的准备工作
和业务方一起梳理规则,主要方法如下:
为应对大促的到来,保证系统的响应时间,需减少一半以上规则。带来问题主要是规则的覆盖度更粗,影响的范围更大,增高了加验率和拦截率,误命中或漏命中的概率更大。
天盾 3.0 系统
1、天盾 3.0 系统
针对原有天盾 2.0 系统配置复杂,规则数量迅速增加导致的系统性能过慢的问题,制作天盾 3.0 系统,解决性能问题和易用性问题
2017 年 1 月开始开发,3 月底试运行,4 月下旬正式上线
2、设计前思考及实现
思考: 如何构建快捷高效的系统?
流程上是否可简化?
系统内部组件关系设计是否合理?
可否减少系统内部的无谓损耗?
系统是否简单易用?
从以上几点考虑着手设计实现天盾 3.0 系统
天盾 2.0 系统流程上是否可以简化?
针对原子规则的获取可以提前计算并预热保存,针对获取决策结果可在单个原子规则执行完毕后提前获取,下图为 3.0 系统简化流程后的新流程:
系统内部组件关系设计是否合理?
2.0 系统内部组件关系
在天盾 2.0 系统中,维度和维度得分未起到实质作用,只是增加了配置和运行复杂度,在 3.0 系统中去除了维度,重新定义原子规则,规则脚本,与决策的配置关系,下图为天盾 3.0 决策配置关系
使用脚本 id 代替维度及维度得分,决策只支持”与”的逻辑关系,上图中根据优先级获得的原子规则为 4,5,1,2,3。
另外从执行完所有原子规则后生成决策结果,变为根据原子规则结果实时生成决策结果。若原子规则 1,2,3,4,5 的取值如下图,则生成决策结果如下
根据决策优先级,决策 2 命中返回结果。
可否减少系统内部的无谓消耗?
在 2.0 系统中,上面几个原子规则会并行执行,并对 jsfA,hbaseA,redisA,jsfB 重复调用多次,产生了无谓消耗,在 3.0 系统中,保证对重复性的查询只查一次
另外在 3.0 系统中,根据规则查询数据的情况,对简单内存计算同步执行,减少多线程执行的消耗,上图中 ruleE 没有查询远程数据,因此只会同步执行
系统是否简单易用?
系统实现对客户要具有良好的使用体验和较小的学习成本。
3、3.0 系统上线后的实际性能情况
同场景同策略条件下天盾 3.0 性能比 2.0 提升近 200ms,如下:
升级前天盾 2.0 主要场景性能
升级后天盾 3.0 主要场景性能
天盾 3.0 系统 618 大促
1、618 大促前准备工作
迁移天盾最主要场景到天盾 3.0 系统
天盾 3.0 上线后系统性能有显著的提升,为保证天盾最主要业务的性能,在已接入的 200 多个业务场景中,选择最重要的业务场景策略迁移至天盾 3.0 系统。
对迁移场景后的天盾 3.0 进行压测
对单一业务压测:
对天盾系统中调用量最高,规则数量及复杂度最高的场景分别进行压测:
对以上业务进行同时组合压测:
以上压测均按最大策略数量进行,系统性能良好,按压测情况 618 无需再像往年大促需要下线规则。
2、618 期间系统实际运行情况
618 零点主要支付场景 1 性能
策略数量是去年双 11 的 2.5 倍以上,性能依然有所提升
618 零点主要支付场景 2 性能
策略数量是去年双 11 的 3 倍以上,性能依然有所提升
从 1.0 到 2.0,再到 3.0,天盾的版本更新见证了京东的飞速发展,相信随着业务进一步高速发展,天盾系统也将不断的迭代优化以满足需求,我们将继续努力,做好京东的保护盾。
评论