数字银行

信用评分:第二部分 - 信用评分卡建模方法

2019-03-21  本文已影响37人  hello_树先生

信用评分:第二部分 - 信用评分卡建模方法

上一篇:信用评分:端到端的开发流程-->第一部分:为什么要做信用评分

基本原理

信用评分 = money?.png

“伟大的设计是通过简单性呈现的极大复杂性。(M.Cobanli)”- 作为数据科学家,我的责任是设计和开发准确的,有用的和稳定的信用风险模型。我还需要确保其他数据科学家和业务分析师可以评估我的模型或复制相同的步骤并产生相同或相似的结果。

在模型开发过程中,我试图从业务中找到许多问题的答案。这些答案有时需要主观判断。只要我能记录我的问题和相应的答案,这种主观主义就没有什么不对。显然,如果我持续将这些问题和答案添加到列表中,那么就有可能最终得到一张难以理解的庞大列表。我也可能最后提出一些重复的问题,甚至是矛盾的答案。

我怎么能确定:(1)我不会错过重要问题的答案; (2)我的模型能否成功通过同行评审或审计过程; 或(3)我的同事能否复制模型结果?

为了满足上述要点,我需要:

一旦我确定了这些重要元素,我就可以开始在我的理论框架的正确桶中填写我的问题,然后继续设计和构建模型。该过程可能如下所示:

开发方法

任何商业,研究或者软件项目都需要一种合理的方法,通常采用理论或概念框架的形式。框架的目的是描述步骤的顺序及步骤间的相互作用。这确保了所有重要阶段的实施,提供了对项目本身的理解,设定了重要的里程碑,并在项目利益相关者之间建立了积极的合作关系。

通常,可以采用不止一种既定方法。数据挖掘项目是可以使用多个概念框架的典型示例。数据挖掘通常涉及用于商业目的的预测模型的开发。具有多学科性质的数据挖掘项目需要从不同角度加以考虑,包括:

Agile-scrum方法是一种时间盒式的迭代式软件开发方法,可逐步构建软件,其关键目标是为业务提供价值。该方法促进了用户的积极参与,利益相关者之间的有效互动和频繁的交付。因此,它非常适合数据挖掘项目,这些项目通常在短时间内进行,需要经常更新以应对不断变化的经济环境。

CRISP-DM是数据挖掘过程模型的主要行业方法。它由六个主要的互连阶段组成:(1)业务理解,(2)数据理解,(3)数据准备,(4)建模,(5)评估,和(6)部署。


图1. CRISP-DM - 数据挖掘框架

预测模型的最终目标是满足特定业务需求,以提高业务和业务流程的性能。业务和数据理解都是CRISP-DM的关键阶段。这两个阶段的结果应该是一个合理的理论框架和模型设计。

理论框架与模型设计

一个理论框架是一个构建块的基础,可以帮助确定一些重要的因素及其在(假设的)预测模型的关系,如信用风险模型。目标是制定一系列假设并决定一种建模方法(例如逻辑回归)用于检验这些假设。然而,更重要的是建立复制/验证结果的方法,以获得对模型严格性的更强信任。

该框架的关键要素是:(1)因变量(标准),例如“信用状态”,(2)独立变量或预测变量,如年龄,住宅和就业状况,收入,银行账户明细,支付历史,或坏账历史,以及(3)可测试的假设,例如“房主不太可能违约”。

该模型的设计应遵循的研究设计方法,对数据采集,测量和数据分析蓝图的公认原则,因此该模型可以用于可靠性和有效性进行测试。前者测试模型产生稳定和一致结果的程度,后者测试模型是否真正代表我们试图预测的现象,即“我们是否构建了正确的东西?”

一个好的模型设计应记录以下内容:

图2.利用历史数据预测未来结果

观察和表现窗口的长度取决于设计模型的行业部门。例如,在银行业中,与电信行业相比,两个窗口通常都更长,其中产品的频繁变化需要更短的观察和表现窗口。

申请评分卡通常应用于新客户,并且没有观察窗口,因为客户使用申请时已知的信息进行评分。征信局数据等外部数据主导了此类评分卡的内部数据。行为评分卡具有利用内部数据的观察窗口,并且倾向于具有比申请评分卡更好的预测能力。

不同的评分卡贯穿使用于客户的整个生命周期中,首先从申请活动开始,以预测客户响应营销活动的可能性。在申请阶段,可以用多种预测模型对客户进行评分,例如他们违反信用义务的可能性或者预测欺诈客户。一系列行为评分卡模型将应用于现有客户,以预测违约概率,以设置信用额度和利率,或计划追加销售和交叉销售活动; 保留活动流失的可能性或预测还贷的可能性或催收目的的“自我修复”概率。

信用评分卡模型开发步骤

一旦指定了理论框架和模型设计,我们就可以为CRISP-DM中的后续步骤做好准备。通过逐个案例的略微修改,下表中列出了信用评分卡开发过程的典型步骤。

表1.搭建标准信用风险评分卡模型的典型步骤.png
上一篇:信用评分:端到端的开发流程-->第一部分:为什么要做信用评分
下一篇:信用评分:第三部分 - 数据准备和探索性数据分析

本文翻译转载自https://www.worldprogramming.com/blog/credit_scoring_pt2

上一篇 下一篇

猜你喜欢

热点阅读