Cook RR语言与统计分析统计

2018-09-30 如何理解survivalROC包的统计

2018-09-30  本文已影响503人  凤凰_0949

生存分析中的ROC是怎么来的,ROC是对二分类资料的评价指标,那对于生存资料呢?

诊断试验中ROC曲线,一般金标准都是二分类变量,比如有病与无病(见下表)。ROC曲线以假阳性率(1-speficicity)作为横坐标,以真阳性率(sensitivity)作为纵坐标,曲线上的点代表不同临界点所对应的灵敏度和特异度对子。通常将ROC曲线左上角那一点定为最佳临界点,此点的Youden指数(sensitivity-(1-specificity))最大。 image.png
如果金标准是生存分析资料(生存时间overall survival time与生存状态 status),能否进行ROC分析呢?能!这就是时间依赖的ROC分析。

在RStudio中我们得到的公式如下:


image.png

每个coef值就是对应基因的回归系数,这样就可以计算风险函数
每一个样本可以通过回归模型得到一个预测生存的概率
而我们用生存概率的中位值为基准,对患者生存分组高低风险组
用预测生存概率与实际患者生存概率(3年或者5年)进行比较,可以计算如下值:
真正(True Positive , TP)被模型预测为正的正样本;
假负(False Negative , FN)被模型预测为负的正样本;
假正(False Positive , FP)被模型预测为正的负样本;
真负(True Negative , TN)被模型预测为负的负样本。
进一步通过公式得到横纵坐标:
其一是真正类率(true positive rate ,TPR), 计算公式为TPR=TP / (TP + FN)
另外一个是负正类率(false positive rate, FPR),计算公式为FPR= FP / (FP + TN)


image.png
  [1] 1.000000000 1.003739767 1.007657787 1.003371314 0.999478253
  [6] 0.994723114 0.993662466 0.988839751 0.983798865 0.979476825
 [11] 0.983132665 0.986985992 0.982022682 0.973123048 0.968767419
 [16] 0.963311391 0.964725581 0.965179152 0.955138320 0.944520226
 [21] 0.939544855 0.935336643 0.930877664 0.927219518 0.921198612
 [26] 0.924697519 0.919033140 0.913448266 0.917021872 0.912368937
 [31] 0.907961696 0.908006753 0.909778279 0.913431262 0.915360070
 [36] 0.906253391 0.901427674 0.892519538 0.883401105 0.887292260
 [41] 0.889338278 0.893599621 0.898224257 0.889352187 0.890626150
 [46] 0.881791375 0.886851339 0.876380812 0.869672909 0.865315947
 [51] 0.855727298 0.850384627 0.855626323 0.857953999 0.851641371
 [56] 0.841369214 0.834472745 0.831696904 0.827362880 0.826691204
 [61] 0.816696509 0.821924772 0.816167822 0.809117525 0.806028778
 [66] 0.797033297 0.788031563 0.788721456 0.767372809 0.758552287
 [71] 0.756401597 0.760039258 0.749974630 0.743244234 0.734442771
 [76] 0.725448415 0.720283380 0.715124702 0.703299178 0.706720027
 [81] 0.703134404 0.706643020 0.696726456 0.685721089 0.674460274
 [86] 0.667861985 0.656372667 0.641863602 0.632051352 0.624949651
 [91] 0.616057660 0.611693628 0.601393745 0.591923069 0.583104097
 [96] 0.574307636 0.568542067 0.564989189 0.556026245 0.555685101
[101] 0.558246518 0.561125567 0.552186636 0.542075488 0.532881204
[106] 0.536266252 0.524809339 0.515588486 0.505068684 0.496247820
[111] 0.500281149 0.505368585 0.496561066 0.487368748 0.494447958
[116] 0.485531940 0.476543753 0.467739718 0.458933845 0.470586788
[121] 0.468113457 0.460217392 0.454561465 0.445778654 0.436809673
[126] 0.427594537 0.418807131 0.409964015 0.401173482 0.377197377
[131] 0.381638735 0.372839787 0.362629905 0.353487134 0.344590384
[136] 0.335392359 0.326599725 0.317345911 0.308522995 0.301017478
[141] 0.292189280 0.284975785 0.275830580 0.266990931 0.257785933
[146] 0.250349724 0.241494252 0.232298124 0.226881817 0.218013711
[151] 0.207928198 0.200274649 0.189759740 0.180900761 0.169368685
[156] 0.160476482 0.165160245 0.156308261 0.148492848 0.141670452
[161] 0.132529867 0.117643850 0.112541948 0.103692496 0.094827012
[166] 0.085941124 0.077028711 0.068080932 0.068931943 0.061272838
[171] 0.052519576 0.043766313 0.035013051 0.026259788 0.017506525
[176] 0.017506525 0.008753263 0.000000000

一共178个样本,每个样本都会得到一个概率值
通过对TPR和FPR计算得到ROC曲线


image.png
上一篇下一篇

猜你喜欢

热点阅读