3句话总结信贷风控的特征

2022-03-08  本文已影响0人  算法进阶

信贷风控是数据挖掘算法最成功的业务场景,简单来说就是判断一个人的还款能力及还款意愿,并以此为信任依据提高金融业务效率。



业界通常的做法是基于挖掘多维度的特征建立一套规则及风控模型,一个好的特征,对于模型和规则都是至关重要的,验证中经常可以发现,如果踢掉某类特征模型也就废了。本文就梳理总结下信贷风控常用的特征,可以总结到以下3句话:

1、信贷历史类: 信贷交易次数及额度、查询征信次数、信贷历史长度、新开信贷账户数、额度使用率、逾期次数及额度、信贷产品类型、被追偿信息。

(信贷交易类的特征重要程度往往是最高的,少了这部分历史还款能力及意愿的信息,风控模型通常直接就废了。)

2、基本资料与交易记录类:年龄、婚姻状况、学历、工作类型及经验、工资收入、存款AUM、公积金及缴税、非信贷交易流水等记录

(基本资料主要是从还款能力上面考量,需要注意的是,还需要多方核验资料的真伪以鉴别欺诈风险。另外的,像性别、肤色、地域、种族、宗教信仰等类型特征使用要谨慎,可能模型会有效果,但也会导致算法歧视问题。)

3、公共负面记录类: 如破产负债、民事判决、行政处罚、法院强制执行、涉赌涉诈黑名单等

(这类特征通常缺失度比较高,对模型贡献一般,更多的是从还款意愿、欺诈维度的考虑)

上一篇下一篇

猜你喜欢

热点阅读