从一张图出发去理解敏感度、特异度和ROC

2021-09-12  本文已影响0人  ADO_AI
图一、同一指标在正常和癌症人群的分布曲线

一、开门见山:敏感度,特异度 or ROC曲线,它反应的都是某种检验指标或者模型对正常/疾病 人群的分类能力,而这种分类能力是什么?就是\color{red}{指标在两个人群的分布重叠度!!} 指标分布重叠越少,该指标对人群的分类能力越强,该指标越好;反之越差

二、真实分布:对于一个检验指标,其真实人群的分布几乎都是如此:得病的人群分布相对右偏,无病的人分布相对低,两者间有重叠。给指标设定任意一个cutoff值,都会得到对应的敏感度,特异度,进而对应ROC曲线上的一个点; 对cutoff取连续值(通常是取所有的观察结果或预测概率值),即得到ROC曲线,而ROC曲线的本质含义就是反应指标的分类能力。

三、理想分布:理想的指标是两个人群分布完全没有重叠,此时ROC曲线下面积为1,不过理想指标往往仅仅存在于“理想”中。之所以ROC曲线下面积为1,是因为此时一定存在一个连续区间(即两分布中间的那个区间),以此连续区间内的值作为cutoff时,敏感度和特异度均为100%。

四、敏感度、特异度的含义(从混淆矩阵出发)

图二、混淆矩阵

参考文献

联川生物--ROC曲线讲解

上一篇 下一篇

猜你喜欢

热点阅读