01-早期诊断的生物标记增加:DIS和PIS
通过对消化系统疾病肿瘤微环境的探索,识别出了在消化类癌症中更为有效和精确的诊断和预后标志物。他们的研究全面分析了免疫细胞在DSC诊断和预后中的作用,并且他们识别的DIS和PIS可以用作早期诊断的生物标记和用来预测DSC病人的生存。
一.研究背景
缩写:
DIS:诊断免疫得分(diagnostic immune score)PIS:预后免疫得分(prognostic immune score)DSC:消化系统癌症(Digestive system cancers)ESCA:食管癌(Esophageal carcinoma)STAD:胃腺癌(Stomach adenocarcinoma)LIHC:肝癌(Liver hepatocellular carcinoma)PAAD:胰腺癌(Pancreatic adenocarcinoma)COAD:结肠腺癌(Colon adenocarcinoma)READ:直肠腺癌(Rectum adenocarcinoma)RFS:无复发生存期(relapse-free survival)
消化系统癌症(DSC)在世界范围内都有很高的死亡率,当前的治疗方法包括手术,放射疗法和免疫疗法等都有所提高。但是,对于DSC本身而言,由于其具有隐藏性、疾病发展迅速以及高侵袭性的特征,晚期的DSC病人的平均生存时间段。因此,去识别DSC疾病的早期诊断标志和预后标志具有重大的意义。
今天小编介绍的这篇文章中,Yang等人通过对TCGA数据库中的食管癌、胃腺癌、肝癌、胰腺癌、结肠腺癌以及直肠腺癌的数据,通过CIBERSORT算法刻画每个样本中22个免疫细胞的组成情况,通过Lasso回归分析识别出一些重要的免疫细胞类,并进一步构造诊断免疫得分DIS和预后免疫得分PIS。
标题:Immune cell infiltration as a biomarker for the diagnosis and prognosis of digestive system cancer
杂志:Cancer Science IF:4.751 发表时间:2019.7.25
二.方法和材料
(1)训练集:从TCGA数据库中的食管癌、胃腺癌、肝癌、胰腺癌、结肠腺癌以及直肠腺癌的共1809个病人的表达谱数据和临床数据。
(2)22种免疫细胞组成:通过CIBERSORT去刻画这些病人22种免疫细胞的组成,在使用CIBERSORT时,迭代计算1000次,只保留那些P<0.05的病人进行后续分析。
(3)识别重要的免疫细胞:通过LASSO分析识别在DSC中扮演重要角色的免疫细胞。基于LASSO分析中的系数,结合每一个病人相应的免疫细胞比率,可以进一步构建诊断免疫得分DIS,如下所示:
DIS = (fraction level of naive B cells × 0.520) + (fraction level of plasma cells × 9.710) + (fraction level of CD4 memory activated T cells × -5.601) + (fraction level of monocytes × 5.640) + (fraction level of M0 macrophages × -4.857) + (fraction level of resting mast cells × 8.246).
(4)生存分析:通过LASSO-COX回归分析,识别影响病人RFS的免疫细胞,根据免疫细胞构建相应的预后模型,预后免疫得分PIS模型,如下所示:
PIS = (naive B cells × −0.207) + (CD8 T cells × −0.008) + (CD4 naive T cells × 0.195) + (CD4 memory acti‐ vated T cells × −0.221) + (follicular helper T cells × −0.083) + (regu‐ latory T cells × 0.055) + (M2 macrophages × 0.272) + (resting mast cells × 0.045) + (eosinophils × −0.101).
(5)验证数据集:从GEO数据库下载GSE23400、GSE13195、GSE22058、 GSE62452、GSE90627、GSE53625、GSE26253、GSE76427和 GSE38832数据,验证构建模型的准确性。
(6)识别新的免疫细胞类:基于样本免疫细胞组成矩阵,通过“cluster”包进行无监督聚类,将病人划分成不同的免疫细胞类,并结合临床数据和DIS以及PIS模型去验证这些不同免疫细胞类之间的特征。
三.结果展示
1. DIS模型的评估:将TCGA数据库中801个肿瘤样本和46个正常样本划分为训练集和测试集,并通过LASSO模型找到在DSC疾病中扮演重要角色的免疫细胞类,并基于这些免疫细胞构建如方法中提到的DIS模型,并在训练集、测试集以及整体样本中评价该DIS模型。如Fig 1所示,Fig 1A是在正常样本和肿瘤样本中相应免疫细胞组成差异的火山图;Fig 1B是LASSO回归模型对22种免疫细胞的系数的可视化;Fig 1C是LASSO回归分析中进行10倍交叉验证中参数调整过程的可视化;Fig 1D-F是训练集、测试集以及整体样本数据集中DIS的曲线下面积(AUC)结果,发现该模型具有一个很好的预测性能。
Fig 1. 消化类癌症的诊断免疫得分DIS评估
2. PIS模型的评估:
通过LASSO-Cox分析,找到影响消化类疾病病人预后的免疫细胞类,如方法中那样构建相应的PIS模型,并在上述划分中的训练集、测试集以及整套数据集中去看高低免疫得分样本的预后情况。如Fig 2所示,Fig 2A是LASSO回归模型对22种免疫细胞的系数的可视化;Fig 2B是LASSO回归分析中进行10倍交叉验证中参数调整过程的可视化;Fig 2C、2E和2F是训练集、测试集以及整体样本数据集中高低PIS得分组病人的生存差异。Fig 2D是训练集样本中1年,2年以及3年的曲线下面积分布。
Fig 2. PIS评估
3. 决策曲线分析:
一般来说,决策曲线是用来评价某个指标对作出临床决策时对患者的益处,将PIS与疾病TNM分期相比较,从2年、3年以及5年RFS时间的角度,在Fig 3中,我们发现PIS预测病人RFS的能力(实线)显著高于TNM(虚线部分)。
Fig 3.决策曲线分析评估PIS的临床应用性
4. Nomogram预测模型:
在训练集中对病人构建Nomogram预测模型,进一步评估不同时间节点病人的复发情况(Fig 4A)。同时在训练集、测试集以及整体数据集中去绘制相应的校正曲线分布情况。发现在训练集、测试集以及整体数据集的Nomogram模型均有一个较好的结果(Fig 4B-D)。其中对角45度的灰色虚线表示最好的预测结果。
Fig 4. 消化系统癌症患者Nomogram的构建和验证
5. 免疫亚型:
基于CIBERSORT算法刻画TCGA数据集中每个样本的细胞组成,并根据该细胞组成进行聚类,最终识别了6个免疫亚型(Fig 5A),并通过k-M分析查看6个免疫亚型病人的生存情况(Fig 5B),并结合PIS打分,看6类病人PIS得分分布(Fig 5C)。
Fig 5. 免疫亚型特征刻画
四.结论
通过对消化系统疾病肿瘤微环境的探索,识别出了在消化类癌症中更为有效和精确的诊断和预后标志物。他们的研究全面分析了免疫细胞在DSC诊断和预后中的作用,并且他们识别的DIS和PIS可以用作早期诊断的生物标记和用来预测DSC病人的生存。
往期分享
02-IF7+:纯生信泛癌分析挖掘可用于ICI应答预测的生物标志物
03-IF6+:纯生信基于网络互作结合基因表达谱、拷贝数变异数据鉴定多发性骨髓瘤标志物