第三章升级管用吗？

2019-10-27 本文已影响0人人工智能人话翻译官

疑惑

你和小白对算法进行了升级，但这次算法升级管用吗？
怎么才能对算法模型进行客观的评价呢？
于是你又一次给“人工智能人话翻译官”发了邮件。很快翻译官做了详尽的回复。

解惑

我们可以从一个医疗的列子，对算法模型如何评价做一个说明。

我们拿到一批医院用来教学用的x光片，其中20人为有病的患者，80人为健康的人，一共100人。

我们分别用P与N代表
P(condition positive)
the number of real positive cases in the data。
Positive ： sick
本例中对应的数字为20
N(condition negative )
the number of real negative cases in the data。
Negative ： healthy
本例中对应的数字为80

然后我们找一位大夫来对这批X光进行判断，得到结果如下：
这里我们用P', N'来表示预测的结果。

P' 22人
该大夫预测有病的患者为22人
其中预测对了18人，错了4人
N' 78人
该大夫预测健康的有78人
其中预测对了76人，错了2人

然后我们就可以根据这批数据以及该大夫的预测结果构造以下矩阵：

image.png

把数据带入该矩阵：

image.png

接下来就是重点了：
根据该医生的判断，有多少病人要被召回医院进行治疗呢，这个比例为多少？
$TPR = \cfrac{真实有病且预测为病人的人数}{真实有病的人数}=\cfrac{TP}{P} = \cfrac{TP}{TP + FN}$
$TPR = \cfrac{18}{20} = \cfrac{18}{18 + 2} = 0.9$

这个比例很形象称为“召回率”。
有的资料也称为：
真阳性率(True Positive Rate，TPR)，灵敏度(Sensitivity)说的都是一回事。

那么这个医生漏诊多少人，比例为多少？

医生把2个有病的人预测为健康，意味该医生漏诊了两个人。FNR就代表了漏诊的比例。
$FNR = \cfrac{预测为健康但实际有病的人数}{真实有病的人数}=\cfrac{FN}{P} = \cfrac{FN}{TP + FN}$
$FNR = \cfrac{2}{20} = \cfrac{2}{18 + 2} = 0.1$

这个比例形象的成为“漏诊率”
有的资料也称为：
假阴性率(False Negatice Rate，FNR)

漏诊率( = 1 - 灵敏度)

那么这个医生误诊多少人，比例为多少？
医生把4个健康的人的人预测为有病，意味该医生误诊了两个人。FPR就代表了误诊的比例。
$FPR = \cfrac{预测为有病但实际健康的人数}{真实健康的人数}=\cfrac{FP}{N} = \cfrac{FP}{FP + TN}$
$FPR = \cfrac{4}{80} = \cfrac{4}{4 + 76} = 0.05$

这个比例形象的成为“误诊率”
有的资料也称为：
假阳性率(False Positice Rate，FPR)，误诊率( = 1 - 特异度)

最后该医生把真实健康的人，预测为健康的有76人。这个比例是多少呢？
$TNR = \cfrac{真实健康且预测为健康的人数}{真实健康的人数}=\cfrac{TN}{N} = \cfrac{TN}{FP + TN}$
$TNR = \cfrac{76}{80} = \cfrac{76}{4 + 76} = 0.95$