16mRNA标签优化2,3期胃癌无复发生存的预测能力
他山之石,可以攻玉。学习他人的科研思维能够使自己思路更明晰。文章是中国人自己写的,虽然分不怎么高,但对于科研小白来说还是有启发意义的。嗯,文章来自于2020.1月J Cell Physiol.细胞生理学杂志,IF4.552(2018),先献上文献吧
题目:
标题.png从题目可以看出作者可能要从公共数据库或自己搜集的样本数据来构建预测模型(16mRNA特征或标签)。
摘要:
行内人都重点看的,分析整个文章的脉络。
高通量的mRNA分析已经成为探索癌症复发及转移机制的重要工具。作者借助GEO数据库GSE62254 (n = 194)通过LASSO Cox回归构建预测模型,通过GSE26253 (n = 297)和TCGA数据库(n = 235)来验证预测。
学习队列及验证队列均能有效的识别2,3期胃癌的高风险患者。Cox回归解释来自16mRNA标签的风险分数是2,3期胃癌独立的风险因素。
作者同时构建了列线图(nomogram)来用于临床。
基因集变异分析解释了一些与肿瘤化疗耐药和转移相关的基因集明显富集到了高风险患者。
16mRNA标签可成为预后评估及发现高风险患者的强有力工具。
资料与方法
主要是筛选方法,如下图:
data screening.png结果:
- Development and validation of prognostic 16‐mRNA signature of Stages II and III GCs
作者先用GSE62254数据进行学习。获得表达数据后进行单因素cox回归分析,获得680个基因。接着,LASSO Cox回归分析得到16个mRNA标签。下图示LASSO Cox回归lamda值的最低标准选择及回归系数:
用16个标签和相应的系数对每个样本进行风险评分(risk score),如下图。评分越高,说明复发风险越高。
risk score.png根据风险评分的中位数将评分分为低危及高危组。进行学习数据集及验证数据集的K-M 生存分析验证,得出16mRNA标签可预测预后的临床意义。如下图:
survival analysis.png- Prognostic value of the 16‐mRNA signature
作者将风险评分、肿瘤分期、年龄及性别作为共变量,纳入单因素及多因素Cox回归分析,以确定16mRNA标签的风险评分是否是2,3期胃癌的独立危险因素。作者在 GSE62254,GSE26253及 TCGA数据库分别进行了Cox单因素及多因素回归分析,如下图:
另外,作者将三个数据集进行综合分析仍可筛选出2,3期胃癌高风险组。
作者对GSE62254数据集中患者的术后化疗进行了分析,揭示了16mRNA标签评分高的组其RFS比较低。
- Construction of nomogram based on 16‐mRNA signature
作者在GSE62254数据集中综合了16mRNA评分及肿瘤分期,Lauren classification, lymph node ratio, and chemotherapy构建列线图。
a图为列线图,表明不同风险在列线图中的贡献及列线图对5年生存的预测。b图为校准图,红色为列线图的预测线,越靠近45度线说明预测性越好(x轴为列线图预测5年生存率,y轴为实际5年生存率)。
ROC and Decision curve analysis.pngc图为ROC曲线,列线图的曲线下面积(AUC) 为 0.8461,说明准确性比较好。d图为决策曲线,检验列线图的效能。若阈值小于0.75,列线图比 treat‐
all‐patients scheme 或者 the treat‐none scheme有更好的预测性,同时比TNM分期有更好的表现。
同时,作者也把16mRNA标签与之前用PEC发表的六个模型在GSE62254及GSE26253数据集进行了比较,结果提示16mRNA标签比其他标签有更小的预测错误曲线(predicted error curve)。
- Identification of 16‐mRNA signature associated biological pathways
最后,作者通过基因集变异分析(Gene Set Variation Analysis,GSVA analysis)识别GSE62254数据集16mRNA标签的相关基因集。通过16mRNA标签将样本分为低危及高危组。通过热图数据可视化来显示一些转移及化疗耐药的基因集富集在高风险组。相关性热图显示在高危组中,16mRNA标签与富集的基因集呈明显的正相关。
结论:
16mRNA标签对临床预后有指导意义,可预测生存及化疗耐药。