秋招-算法

AUC与ROC

2018-10-09  本文已影响4人  0过把火0

分类任务不同于回归,本次记录一下分类任务中常用的评价指标AUC与ROC

混淆矩阵

在搞清楚ROC和AUC之前,需要先弄明白混淆矩阵
混淆矩阵中有着Positive、Negative、True、False的概念,其意义如下:
○ 称预测类别为1的为Positive(阳性),预测类别为0的为Negative(阴性)。
○ 预测正确的为True(真),预测错误的为False(伪)。
那么就产生了如下的混淆矩阵:


AUC与ROC

其实也就是 y=x直线,其含义为将正类预测正确的概率=将负类预测正确的概率=0.5,那么就容易看出来,我们期望该条线尽量往左上方偏,也就是尽量让正类预测正确的概率大一些,如下面的图:


AUC的优势:

AUC的计算方法同时考虑了分类器对于正例和负例的分类能力,在样本不平衡的情况下,依然能够对分类器作出合理的评价。因此AUC的目的就是用于平衡准确率与召回率。

例如在反欺诈场景,设非欺诈类样本为正例,负例占比很少(假设0.1%),如果使用准确率评估,把所有的样本预测为正例便可以获得99.9%的准确率。
但是如果使用AUC,把所有样本预测为正例,TPRate和FPRate同时为1,AUC仅为0.5,成功规避了样本不均匀带来的问题。

转载注明:https://www.jianshu.com/p/cb2ec4ff10eb

上一篇下一篇

猜你喜欢

热点阅读