报名参加CloudWeGo黑客松,奖金直推双丰收! 了解详情
写点什么

基于 Logistict 回归的评分卡模型

  • 2020-03-22
  • 本文字数:1970 字

    阅读完需:约 6 分钟

基于Logistict回归的评分卡模型

1 评分卡分类


A 卡(Applicationscore card)新客户申请审批


  • 更准确地评估申请人的未来表现(违约率),降低坏帐率;

  • 加快(自动化)审批流程, 降低营运成本;

  • 增加审批决策的客观性和一致性,提高客户满意度;


B 卡(Behaviorscore card)现有客户管理


  • 更好的客户管理策略, 提高赢利;

  • 减少好客户的流失;

  • 对可能拖欠的客户,提早预警;


C 卡(Collectionscore card)早期催收


  • 优化催收策略,提高欠帐的回收率;

  • 减少不必要的催收行为,降低营运成本。

2 模型开发全流程

用一张图为大家展示,量化团队分析师开发评分卡模型的全流程,以及具体实现方式:



Step1:变量初选


通过等频分箱或最优分箱离散原始数据,计算 IV 值,剔除预测能力差的指标。


  • 信息值(information value,简称”IV”)是常用的进行自变量筛选的指标,计算简单,并且有经验的判断法则,IV 值的计算公式为:





Step2:变量剔除


通过变量聚类或者计算相关系数的方法剔除变量,这一步主要目的是解决多重共线性问题。多重共线性(Multicollinearity)是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。


Step3:数据离散化


数据离散化的目的是降低异常值的影响,同时增加模型的可解释性,通过 BESTKs、卡方合并、决策树等有监督算法将连续变量离散化几个区间,然后进行 WOE 转换。


  • 证据权重(Weight of Evidence,简称“WOE”)



WOE 是对原始自变量的一种编码形式,要对一个变量进行 WOE 编码,需要首先把这个变量进行分组处理(也叫离散化、分箱)。



Step4:初步建模


将原始指标用 WOE 进行替换后,用 logistic 回归估计参数,并剔除参数估计为负的变量。


下面让我们来了解一下信用评分卡模型所依赖的 Logistic 回归算法。何为“回归”呢?当有一些数据点,用一条直线对这些点进行拟合(该直线称为最佳拟合直线),这个拟合过程就叫回归。那么,利用 Logistic 回归进行分类的主要思想就是根据现有数据对分类边界线建立回归公式,以此进行分类。“回归”源于最佳拟合,即使用最优化算法,找到最佳拟合参数集。


  • Logistic 回归的实现:对于输入特征,每个特征乘以一个回归系数,将所有结果值相加带入 Sigmoid 函数中,从而得到一个 0~1 之间的数值,根据实际情况设定相关阈值,从而达到预测的目的。

  • 最优化算法:如何找到最优回归系数,是 Logistic 回归的关键问题。



即:找到上式的w\dot机器学习中常用的最优化算法有:梯度下降法(GradientDescent)、牛顿法和拟牛顿法(Newton’s method & Quasi-NewtonMethods)、共轭梯度法(Conjugate Gradient)等等,接下来简单介绍梯度下降法。


  • 梯度下降法(Gradient Descent):梯度下降即沿着某函数的梯度方向,找到该函数的最小值,如果梯度记为▽,则函数 f(x,y)的梯度为:



则梯度下降算法的迭代公式为:,其中,为步长。


Step5:人工干预


根据指标的业务意义、上下限、人数占比、违约比例调整分箱规则,即业务干预。


Step6:WOE 更新


人工干预后,得到新的分箱,根据新分箱,更新 WOE。


Step7:模型更新


更新完 WOE 之后,利用新的 WOE 值估计回归参数。


Step8:分数转化


根据 Logistic 回归估计的参数、分箱的 WOE 来确定每个区间的得分。


Step9:模型效果评估


我们利用 AUC、KS 等指标评估模型的预测能力。


  • AUC(Area Under Curve)


AUC 实际上就是 ROC 曲线下的面积,ROC 曲线反映了分类器的分类能力,结合考虑了分类器输出概率的准确性,AUC 量化了 ROC 曲线的分类能力,越大分类效果越好,输出概率越合理。


  • KS (Kolmogorov-Smirnov)


K-S 统计量被应用于信用评级模型主要是为了验证模型对违约对象的区分能力,是表现模型区分能力的验证指标;通常,如果模型的 K-S 统计量越大,表明模型区分正常客户和违约客户的能力越强。


Step10:模型监控


  • PSI (population stability index)


系统稳定性指数,主要考察了模型预测结果的稳定性,通过对建模样本和监控样本中客户的评分或评级分布的比较来判断模型预测结果的稳定性。系统稳定性指数越小,越稳定,表明监控样本的分数的分布情况和建模样本中的情况越相似,可以预期模型在监控样本中的性能表现和建模样本中的性能表现会很接近。


Step11:评分


下面的小示例,简单为大家展示评分卡及其计分模式:



如果该模型的基础分是 50 分,比如有个客户,大专毕业,男性,拥有自有住房,工作 10 年以上,那么他的分数就应该是:Score=50+14+9+24+12=109。

3 总结

本文介绍了基于 Logistic 回归的评分卡模型的实现流程,介绍了 Logistic 算法、IV 值和 WOE,以及评价模型的指标 AUC、ks 值、PSI 等。在实际应用中,评分卡模型的作用日渐突出。量化团队根据业务需要开发各种不同评分卡模型,并尝试不同算法建模,试图更加科学、准确地构建模型,降低误判率,增加审批的客观性,提高客户的满意度。


2020-03-22 21:042152

评论

发布
暂无评论
发现更多内容

技术团队如何高效落地代码CR

慕枫技术笔记

架构 后端 9月月更

Vue基础语法--插槽(Slot)基础使用

Sam9029

Vue 前端 基础 9月月更

ShareSDK Android端主流平台分享示例

MobTech袤博科技

an'droid

Dubbo Mesh:从服务框架到统一服务控制平台

阿里巴巴中间件

阿里云 微服务 云原生 dubbo

前端食堂技术周刊第 51 期:pnpm v7.10.0、8 月登陆网络平台的新内容、重新思考流行的 Node.js 模式和工具、打包 JavaScript 库的现代化指南

童欧巴

chrome Node React Chrome开发者工具 pnpm

对jdbc的讲解

楠羽

JDBC 笔记 9月月更

轻松理解20种常用AI算法

Baihai IDP

AI 算法

行业智能化走向何方?昇腾AICE带来的新范式,新起点

脑极体

发挥CODING 敏捷开发能力,腾讯云加速提升国产芯片研发效率

科技热闻

Dragonfly 基于 P2P 的文件和镜像分发系统

SOFAStack

容器 云原生 镜像 日志 文件

设计模式的艺术 第八章建造者设计模式练习(开发一个视频播放软件,为了方便用户使用,该播放软件提供多种界面显示模式,例如完整模式、精简模式、记忆模式、网络模式等。在不同的显示模式下主界面的组成元素有所差异。例如,在精简模式下只显示主窗口、控制条)

代廉洁

设计模式的艺术

观测云&亚马逊云科技「可观测性体验日」北京站圆满落幕

观测云

面向对象分析与设计的底层逻辑

阿里巴巴中间件

阿里云 云原生

lodash 在vue3+vite中按需加载

木叶🐱

vite Vue3 lodash

使用 CRD 开启您的 Ingress 可观测之路

观测云

mysql查询 limit 1000,10 和limit 10 速度一样快吗?如果我要分页,我该怎么办?

Java快了!

MySQL

WAIC 2022 | 洞见科技王湾湾出席BPAA第二届应用算法实践典范,共话前沿算法产业发展

洞见科技

2022服贸会 | 洞见科技姚明:从智能化到密态化,数据科技向善升级

洞见科技

蓝凌OA

科技云未来

设计模式的艺术 第七章原型设计模式练习(在某销售管理系统中设计并实现了一个客户类Customer,其中包含一个名为客户地址的成员变量,客户地址的类型为Address。用浅克隆和深克隆分别实现Customer对象的复制)

代廉洁

设计模式的艺术

WAIC 2022 | 洞见科技在可信AI论坛联合发布《可信人工智能产业生态发展报告》

洞见科技

数据治理的内核:数据质量

小鲸数据

数据治理 数据质量管理 数据质量 数据生命周期

LeetCode-26. 删除有序数组中的重复项(java)

bug菌

9月日更 Leet Code 9月月更

与紧张为友,享受紧张

宇宙之一粟

读书笔记 个人成长 演讲 9月月更 享受紧张

动态规划-编辑距离

wing

为什么要用小程序容器做小程序生态

Geek_99967b

小程序 小程序容器 小程序开发

Koordinator 0.6:企业级容器调度系统解决方案,引入 CPU 精细编排、资源预留与全新的重调度框架

阿里巴巴中间件

阿里云 云原生 Koordinator

用过这个API接口工具后,确实感觉postman有点鸡肋......

Liam

Java Postman swagger API开发 API调式

ShareSDK iOS端微信如何获取authcode值

MobTech袤博科技

微信 iOS SDK

小程序容器技术加入到混合App开发队伍

Geek_99967b

小程序 混合开发

MobLink后台基本配置

MobTech袤博科技

android 开发者 iOS SDK

基于Logistict回归的评分卡模型_文化 & 方法_京东数字科技产业AI中心_InfoQ精选文章