【机器学习】性能评测:分类常用
2021-09-28 本文已影响0人
宅家学算法
在机器学习、数据挖掘、推荐系统完成建模之后,需要对模型的效果做评价。目前常常采用的评价指标有准确性(Accuracy)、召回率(Recall)、精确率(precision)、F值(F-Measure)等。本文就水水的介绍一下这些指标。
- 1.准确性(Accuracy):在分类问题中,预测值与测试集原本正确值进行对比,计算样本预测正确的百分比,这个百分比就是准确性。
然而,有些实际问题中(分类),往往会关注模型对某一特定类别的预测能力。这个时候,准确性就不是很好的选择了。比如经典的“良/恶性肿瘤预测任务”里,往往会关系恶性肿瘤的诊断概率。也就是说,在这样一个二分类(A-Positive、B-Negative)问题中,存在真A判A(TP-True Positive)、真A判B(FN-False Negative)、真B判B(TN-True Negative)、真B判A(FP-False Positive)四种可能性。 - 2.召回率(Recall):覆盖面的度量,度量有多个正例被分为正例
- 3.精确率(precision):被分为正例的示例中实际为正例的比例
召回率和精确率的区别在于分母不同,召回率的分母是TP+FN,精确率的分母是TP+FP
- 4.F1指标(F1 measure):召回率和精确率的调和平均数(2/(1/precision + 1/Recall))