对AUC和ROC曲线的理解
2017-07-12 本文已影响0人
Nice_mood
ROC:Receiver Operating Characteristic
AUC:Area Under Curve 即ROC曲线下的面积
ROC曲线有一个很好的特性,当正负样本的比例变化的时候,ROC曲线保持不变。因此比准确率适合用来评估分类器的优劣
绘制ROC曲线的方法:对某个分类器而言,将所有样本的概率输出(是正样本的概率)从大到小排序,从高到低,依次将概率值作为阈值计算TPR和FPR的值从而得到(FPR,TPR)的一个点,这样,次分类器就映射为ROC平面上的一个点,调整这个分类器分类的时候使用的阈值(threshold,大于阈值为正样本,小于阈值为负样本),我们就可以得到一个经过(0,0)和(1,1)的曲线,就是这个分类器的ROC曲线。
PS:TPR为真正率,FPR为假正率。即预测为正样本的所有样本中实际为正样本的个数占所有实际正样本个数的比例和实际为负样本的个数占所有实际负样本个数的比例