机器学习小组评分卡

评分卡|分类学习器的评估

2017-09-14  本文已影响692人  JSong1122

信用评分卡主要有三种(A卡、B卡、C卡):

简单来讲,评分卡用分数来预测客户的好坏。当一个评分卡已经构建完成,并且有一组个人分数和其对应的好坏状态的数据时,我们想知道所构建的评分卡是否可靠?可靠程度如何?而这取决于如何去定义这个“好”字。一般有三种角度可以来评估:


令s是分类学习器预测的结果,可以是好人坏人这样的类别,也可以是一个概率值,大于多少才进一步判定为坏人,还可以是一个信用评分,大于多少才进一步判定为好人。至于是哪种跟我们选用的模型有关,不过目前逻辑回归和随机森林等都支持输出概率值或者信用评分。

从测度论的角度来看,模型评估的是预测变量和实际变量之间的相似度或距离。在这块有很多的指标,有统计检验的,有信息论的,也有概率论的,每个指标都有其优劣和适用场景。

因为是分类器,所以实际分类变量比较简单,肯定是因子型的离散变量,在评分卡中其分布就是pG 和pB。而预测变量的类型就不确定,不过没关系,我们统一考虑它的密度函数f(s)和分布函数F(s)。

当预测变量的阈值选好后,即每一个样本都被预测了,这时候预测变量也变成了与实际类别变量相同的离散变量,则预测类别变量和实际类别变量的混淆矩阵为:

实际坏人 实际好人
预测坏人 TP(真正例) FP(假反例)
预测好人 FN(假正例) TN(真反例)

要注意的是,此时预测变量虽然是离散的,但我们仍然可以用概率来表示混淆矩阵。设样本数为N,f(s|G)和f(s|B)分别为好人和坏人的条件密度函数,nG和nB分别表示总体中好人和坏人的数量,则上述的混淆矩阵可以表示为:

实际坏人 实际好人
预测坏人 p(s ∈ 坏人|B) nB p(s ∈ 坏人|G) nG
预测好人 p(s ∈ 好人|B) nB p(s ∈ 好人|G) nG
总体 nB nG

接下来我们就可以定义和分析各种距离/指标啦。

1、分类学习器的性能度量

性能度量反映了任务需求,在对比不同的模型能力时,使用不同的性能度量往往会导致不同的评判结果;这意味者模型的“好坏”是相对的,什么样的模型是好的,不仅取决于算法和数据,还决定于任务需求。

在预测任务中,给定样例集

(a)好人、坏人均值相差很大,(b)好人、坏人均值相差不大

3.1 马氏距离

马氏量比较简单,它就是两个概率密度函数的众数之差/标准差

这其中常用的有:

上一篇 下一篇

猜你喜欢

热点阅读