零公式讲解统计学——灵敏度(sensitivity)与特异度(s
今天来聊聊特异度(specificity)与灵敏度(sensitivity),以及衍生出的阳性/阴性预测值(Positive and Negative Predictive Value)。
在现实生活中,几乎不存在100%的概率,尤其是一些医学测试,就算有99.99%的准确性,也含有0.01%的错误可能。由此,在统计中衍生出一些定义,比如特异度与灵敏度。
假设我们有一位患者,他被怀疑患有某种癌症,这种癌症可以通过血液检测出来。那么在事实层面上,他可能患有癌症,也可能不患有癌症。通过血液检测,他的结果可能为阳性(患有癌症),也可能为阴性(不患有癌症)。在检测结果和事实之间,存在着许多的可能性。在统计学中,以下几种可能性是我们经常关注的。
a. 假设该病人患有癌症,血液结果为阳性的可能性是多少?这个问题代表了在事实(癌症)存在的情况下,该种测试能够正确检测出事实的概率,这就是灵敏度(sensitivity)。
b. 假设该病人不患有癌症,血液检测结果为阴性的可能性是多少?这个问题代表了在事实(癌症)不存在的情况下,这种测试能够正确检测出事实的概率,这就是特异度(specificity)
灵敏度和特异度都代表了某种测试可以正确检测出事实的可能性,但是侧重点却不同。灵敏度和特异度表示某种测试在人群中的检测效果,是站在宏观和医学研究的角度上来说的。
灵敏度和特异度之间有着反比的关系,意思就是一个高,另一个就会低。通常在医学上,我们都会希望某种检测的灵敏度比较高,并不会对于特异度特别苛求。因为假设一个病人真的患有癌症,该种检测如果无法正确检测出来的话,代价是很大的,可能会延误病人的治疗时机,导致非常严重的后果。
假设病人并不患有癌症,检测结果却为阳性的话,可以对病人通过重复检测,或用其他检测方式来确认,并不会造成太过严重的后果。
另外,在已知实验结果的情况下,我们也想知道患者患病的可能性。
c. 假设血液结果为阳性,那该病人患有癌症的几率是多少?假设血液结果为阴性,那该病人不患有癌症的几率是多少?这个两个问题代表了在已经知道检测结果的情况下,事实存在的概率,这就是阳性/阴性预测值。
阳性/阴性预测值更代表了在患者的角度来看检测结果。一名患者在得到测试结果后,利用阳性/阴性预测值就可以很清楚地知道他自己患病和不患病的概率。
在金融领域里,大家可能更关注阳性预测值,比如股市在我预测为涨的情况下,实际涨的概率,因为这个直接涉及到投资的盈利和损失。
以上的四个概念是可以互相转换的。眼尖的读者可能已经发现了,灵敏度和阳性预测值,特异度和阴性预测值, 这两对是“翻转”的条件概率。一个是已知事实情况下的检测结果的概率,一个是已知检测结果下的事实的概率。这两个概率之间可以利用我们介绍过的“贝叶斯定理“来互相转换。