精确率和召回率(Python)

2020-04-27  本文已影响0人  学人工智能的菜菜

继之前讲的贝叶斯实现垃圾邮件分类模型,那么如何评判该模型是好还是坏呢?
对于二分类问题,采用二分问题进行解析,如下图所示:
假如有20个正常邮件,其中四个被分为垃圾邮件,五个垃圾邮件,其中三个被分为正常邮件。
画出二分类的关系图如下图所示:


image.png

如何衡量这个分类器的好坏呢?有几个标准。

1、准确率

准确率accuary = 正确的/总的 = 16+3/16+4+2+3 = (TP+TN)/(TP+FP+FN+TN)
这个方法只能计算正样本和负样本比较平衡的情况下效果较好,如果正负样本分布很不平衡,就结果不可靠。
比如我有995个正样本,只有5个负样本,如果全部猜对是正样本的话,概率还是有99.5%的。所以这样子就无法估算该模型是否可靠了。
那么是否还有其他的评判标准呢,有的,就是下面的精确率和召回率

2、精确率和召回率

上一篇 下一篇

猜你喜欢

热点阅读