假阳性与假阴性
1.假阴性false negative和假阳性false positive
概念理解
当你真的没有的时候,别人却说你有—假阳性(false positive),属于一类错误。
当你真的有的时候,别人却说你没有—假阴性(false negative),属于二类错误。
下面表格列出了四种情况,另外两张判断正确的情况分别是:
你真的有,别人也说你有—真阳性(true positive)
你真的没有,别人也说你没有—真阴性(true negative)
image.png
image.png
所以,我们可以看到true和false其实是:实际情况和判断的是否一致,如果一致的话,就是true;如果不一致的话,就是false;而positive和negative则是针对判断的情况:如果判断是“有”、“存在”等肯定意义的情况,则是positive;如果判断是“没有”、“不存在”等否定意义的情况,则是negative。
举个例子
假设美国只有1%的人有过敏这种病,现在进行国民大体检,当检查一个过敏病人时,他有80%的几率被检测出过敏,有20%的几率检测不出过敏。当检查一个正常的人的时候,他有10%的几率被误诊为过敏,有90%的几率检测不出过敏。其实就是下面的这个表:
image.png
所以
当一个正常人被检测成“过敏”,这就是假阳性。你没病却说你有病。
当一个过敏病人被检测成“不过敏”,这就是假阴性。你有病却说你没病。
=========================================================
翠花感觉身体不舒服发痒,然后她去做了检测,她被检测成“过敏”,但是我们已经知道了检测是会出现误诊的。所以,我们想知道,在翠花被检测出“过敏”之后,她真的是一个过敏病人的概率是多少?
可以通过画柱状图计算
把例子中提到的所有信息整理成一张图:
image.png
最后一列,总的概率0.8%+0.2%+9.9%+89.1%=100%
两个“有”的概率是0.8%和9.9%,0.8+9.9=10.7%
但只有0.8%是真的有,所以概率是0.8/10.7=7%。
还有一种方法是通过贝叶斯公式计算
等有时间再整理