R语言机器学习与临床预测模型21--预测模型的评价指标
本内容为【科研私家菜】R语言机器学习与临床预测模型系列课程
R小盐准备介绍R语言机器学习与预测模型的学习笔记
你想要的R语言学习资料都在这里, 快来收藏关注【科研私家菜】

00 混淆矩阵

混淆矩阵包含四部分的信息:
True negative(TN),称为真阴率,表明实际是负样本预测成负样本的样本数
False positive(FP),称为假阳率,表明实际是负样本预测成正样本的样本数
False negative(FN),称为假阴率,表明实际是正样本预测成负样本的样本数
True positive(TP),称为真阳率,表明实际是正样本预测成正样本的样本数
01 准确度
准确度是一个指标,它给出了我们的模型正确预测的分数。
准确度=正确预测数/预测总数。

02 召回率(敏感度或真正例率)
召回率给出你正确识别为阳性的分数。召回率表示的是样本中的阳性有多少被预测正确了。那也有两种可能,一种是把原来的阳性预测成正类(TP),另一种就是把原来的阳性预测为负类(FN)。

03 精确度
精确度指所有预测为阳性结果中正确识别为阳性的分数。

04 F1分数
F1分数为模型精度和召回率的调和平均值

04 F1分数
ROC是另一种常用的评估工具。它给出了模型在0到1之间每一个可能的决策点的敏感性和特异性。对于具有概率输出的分类问题,阈值可以将概率输出转换为分类。
对于每个可能的阈值,ROC曲线绘制假正例率与真正例率。
假正例率:被错误分类为正例的反例实例的比例。
真正例率:正确预测为正例的正例实例的比例。
ROC曲线一定程度上可以反映分类器的分类效果,但是不够直观,我们希望有这么一个指标,如果这个指标越大越好,越小越差,于是,就有了AUC(Area under the ROC curve),就是ROC曲线下的面积。AUC直观地反映了ROC曲线的分类能力。

AUC = 1,代表完美分类器
0.5 < AUC < 1,优于随机分类器
0 < AUC < 0.5,差于随机分类器
关注R小盐,关注科研私家菜(VX_GZH: SciPrivate),有问题请联系R小盐。让我们一起来学习 R语言机器学习与临床预测模型