Lending Club贷款不良率单因子WOE/IV分析

2019-03-19  本文已影响0人  马骋

Lending Club P2P借贷风险策略分析文中分析了LC贷款风险的相关影响因素,但不够量化、系统。

参考信用评分卡模型,对风险因素的量化分析可以采用WOE(Weight of Evidence)和IV(Information Value)评价。

结论和观点

对多个特征变量进行单因素IV分析:

可以看出,影响贷款风险的关键因素是信用水平+经济水平。通过IV值筛选出关键因素后,可以使用特征继续进行分类回归建模。

以上分析在总体样本上进行,如果对用户分层、分群,在群体内分析IV可能得到不一样的结论。

分析流程

关注的结果为贷款是否不良(Good/Bad),要分析各个特征变量对贷款是否不良的影响程度。

考虑数据集的特征,处理流程:

单因子WOE、IV分析

以利率数据的处理为例。

根据IV的定义,IV值判断变量预测能力的标准是:

可以看出贷款利率的水平对不良贷款风险的预测能力很强。

WOE、IV分析结果

选取15个特征进行分析,包括grade、term_num(分期数)、home_ownership(住房产权)、income_level(收入水平)等等。

计算所有变量的IV值,只保留IV>0.02的特征:

特征 IV值 语义
grade 0.32024 贷款评级(A-G)
interest_rate_level 0.30449 贷款利率水平
term_num 0.04447 分期数(36或60)
dti_level 0.03642 LC以外的还款数额,与月收入的比值
purpose 0.03164 贷款目的用途
revol_util_level 0.02671 信用卡贷款循环利用率
home_ownership 0.02301 住房状态(自有、租住、按揭、其他)

分析:

综上,可以得到一个直观的结论:贷款不良率主要由贷款人信用水平和经济收支状况相关,其余因素影响较小。

上一篇 下一篇

猜你喜欢

热点阅读