风控建模之woe分箱

2021-04-16  本文已影响0人  7NIC7

一、自动分箱-粗分箱方法介绍

约定初始化分箱的个数为10。
定义:woe_{bin} = \log \frac{bad_{bin}/bad_{total}}{good_{bin}/good_{total}},bin代表箱子。
woe的含义是什么呢?我们可以想一下,假如不对变量进行分箱,即只有一箱,那么该箱的woe值是多少呢?答案是woe=0。因为,
\begin{align} \sum bad_{bin} &= bad_{total} \\ \sum good_{bin} &= good_{total} \end{align}
现在我们可以尝试理解一下若woe大于0或者woe小于0代表了什么?从上面的推导我们可以得知当箱子内的坏好比和整体坏好比(可以理解为“大盘”)相等时,woe为0。那么woe大于0,就可以理解为箱子内的坏好比是高于“大盘”的,箱子内的客户质量较差;woe小于0,是箱子内的坏好比低于“大盘”,箱子内的客户质量较好。

1.1 iv

1.2 mapa

MAPA 单调相邻池化,也称为最大似然单调粗分类,该方法可以使得分箱得到的woe与bin呈现单调上升或单调下降的关系。

1.3 树分箱

二、分箱实操

分箱是一个很细的工作,需要丰富的风控经验,在经验不足的情况下,可以参考下面的一些注意事项和原则。

上一篇下一篇

猜你喜欢

热点阅读