重复一篇3分左右纯生信文章(第二部分)
重复一篇3分左右纯生信文章(第一部分)
方法
生存分析和套索回归,ROC曲线
使用单变量Cox模型计算每个lncRNA的表达水平与患者的总体存活(OS)之间的关联。当其P值小于0.05时,lncRNA在单变量Cox分析中被认为是统计学上显著的。接下来,采用多变量Cox分析来评估lncRNA是否为OS的独立预后因素。进行后向逐步筛选方法以进一步选择最佳模。然后,通过Lasso回归筛选确认所选择的lncRNA。基于表达水平乘法回归模型(β)与线性组合建立基于lncRNA的预后风险评分。预后指数PI=(β* C9orf139的表达水平)+(M * 600HG的β表达水平)+(RP5- 965G21.4的β表达水平)+(RP * -436K8.1的β*表达水平)+(β *表达水平CTC-327F10.4)。基于PI中位数,PDAC患者被分为高风险组和低风险组。并且绘制低风险组或高风险组病例的Kaplan-Meier生存曲线。为了进一步验证基于5-lncRNA的预后指数是否独立于其他临床变量,分别使用单变量和多变量Cox回归分析进行分析。通过比较基于预后指数的生存预测的敏感性和特异性,使用5年ROC曲线评估其预后性能。
结果
差异表达的lncRNA谱和临床特征的预后评估
我们在差异表达的lncRNA进行了单变量Cox回归,结果显示总共13个lncRNA(MIR600HG; CC9orf139; CTC-327F10.4; RP11-452H21.4; RP11- 489O18.1; RP11-436K8.1; RP5-965G21.4; RP11-286H15.1; RP11-118B22.4; CTD-2527I21.15; CH507-513H4.5; FAM53B-AS1;和RP11-430C7.5)与OS显着相关。应用多元Cox比例回归确认上述结果,我们发现5个lncRNA(C9orf139,MIR600HG,RP5-965G21.4,RP11-436K8.1和CTC-327F10.4)被证明是独立的PDAC的预后指标(表1)。接下来,我们使用Lasso回归来验证其他变量,并观察到相同的结果(图2)。预后指数PI估算如下:( - 0.235 * C9orf139的表达水平)+(-0.403 * MIR600HG的表达水平)+(0.163 * RP5-965G21.4的表达水平)+(-0.187 *表达水平为RP11-436K8.1)+(CTC-327F10.4的0.185 *表达水平)。我们计算了每位患者的预后指数PI,并根据中位数将患者分为高风险或低风险(图3)。结果显示 CTC-327F10.4和RP5-965G21.4在两组中均为高表达,而C9orf139和MIR600HG,RP11-436K8.1均为高表达。两组中PDAC组的低表达(图4)。高风险组和低风险组的Kaplan-Meier曲线如图5所示。高风险评分的患者OS风险低于风险评分低的患者(中位OS为15.8个月vs 14.2个月)。单变量Cox比例风险回归方法产生的风险评分HR为2.11(95%CI,1.37-3.24),多变量Cox比例风险回归方法也显示类似的结果(HR = 1.91,95%CI:1.22-2.98)。我们采用时间依赖性ROC曲线来评估5-lncRNA生物标志物的预后能力。在5年OS时,6-lncRNA生物标志物预后模型的AUC为0.727(图6)。
图片效果如下:
image.png
image.png
image.png
image.png