29-多组学联合分析重建胆管癌中不良预后亚型
一.研究背景
肝内胆管细胞癌(intrahepatic cholangiocarcinoma,iCCA)是指起源于二级胆管及其分支上皮的腺癌,iCCA是第二常见的原发性肝癌,恶性程度较高,预后较差[1]。在此,为大家介绍一篇发在Hepatology 上的关于预后相关低氧免疫分类器的文献【Integrative Analysis Defines Distinct Prognostic Subgroups of Intrahepatic Cholangiocarcinoma 2019.1.3 IF:14.971】
Benjamin Goeppert等人通过整合52个iCCA病人的拷贝数改变数据、甲基化数据以及“MeDeCom”算法[2]得到的细胞组成数据,他们通过“iClusterPlus”识别了iCCA病人四个主要的亚型(如Fig 1所示),即IDH组, L(低改变)组,M(中等改变)组和H(高改变)组,他们发现这些亚型具有广泛的基因组、表观组、预后以及细胞来源的差异。其中,“MeDeCom”是一种R包,该包基于样本DNA甲基化谱刻画其相应细胞组成情况,具体使用参照https://github.com/lutsik/MeDeCom。
因此,根据Benjamin Goeppert等人的研究,根据病人相应的分子谱识别iCCA病人亚型,针对不同亚型的病人给予相应的治疗方案,这位iCCA的治疗指明新的方向。
Fig 1. 分析流程二.主要方法和材料
(1)数据:52个iCCA病人和12个非非肿瘤性胆囊切除术的胆囊管正常样本的甲基化(HumanMethylation450)和拷贝数数据。TCGA数据库中TCGA胆癌(CHOL)数据集(n=51)对应的拷贝数以及表达谱数据。TCGA胆癌(CHOL)、肝细胞肝癌(LIHC)和胰腺癌(PAAD)的甲基化数据。
(2)肿瘤纯度的计算:基于甲基化数据,使用LUMP(leukocytes unmethylation for purity)方法[3]去估计每一个样本的肿瘤纯度,该值的范围是[0,1]。
(3)样本中不同细胞类型组成的刻画:输入甲基化数据,通过R包“MeDeCom”得到样本中不同的潜在甲基化组成(latent methylation components,LMCs)。
(4)iCCA亚型的划分:整合样本的拷贝数数据、甲基化数据以及“MeDeCom”得到的LMCs组成表达谱数据聚类,通过R包“iClusterPlus”对样本进行聚类,得到iCCA的亚型。
(5)生存分析:log-rank检验识别各亚型之间的生存曲线差异,通过构建cox回归模型,评价各亚型是否显著和生存相关。
三.结果展示
1. iCCA病人中突变特征的获取:
首先得到在CCA中突变的40个基因列表,接下来去测这40个基因在36个iCCA病人中的外显子数据,进而去识别和iCCA相关的基因突变。在Table 2中,Luo等人识别到了24个突变事件的发生,其中IDH1、IDH2以及TP53基因是频发的错义突变(Recurrent missense mutations)。进一步结合病人的拷贝数数据,得到iCCA中出现的整个染色体臂出现的扩增或缺失基因(Table 3),以及仅跨越染色体臂的一小部分(focal)区域扩增和缺失的基因(Table 4)。
2. iCCA样本的甲基化特征描述:
基于10000个高度变异甲基化基因,对样本进行聚类和计算其相应的肿瘤纯度,通过热图展示疾病和正常样本中甲基化表达模式(如Fig 2A所示),统计低甲基化的基因主要集中发生在基因的哪个区域(如Fig 2B所示)。接下来,通过GO数据库对高甲基化(|β|>0.2 & FDR q<10-300)的基因进行功能富集分析(如Fig 2C),并通过MeDeCom刻画
Fig 2. iCCA样本甲基化特征刻画3. iCCA亚型识别:
整合拷贝数数据、甲基化数据以及“MeDeCom”得到的LMCs组成表达谱数据聚类,通过R包“iClusterPlus”将样本划分成四类,即IDH组, L(低改变)组,M(中等改变)组和H(高改变)组(Fig 3A),进一步刻画这四个亚型的生存差异(Fig 3B)。
Fig 3. iCCA亚型的识别4. iCCA亚型拷贝数特征:
拷贝数改变层面,基于Table 4中的候选基因(扩增/缺失),进一步利用TCGA数据库中CHOL(胆癌)疾病的拷贝数以及基因表达谱数据,识别出那些显著受扩增和缺失影响的基因,并进一步分析四个iCCA亚型中拷贝数改变情况(如Fig 4所示)。
Fig 4.iCCA亚型拷贝数特征. A)四个亚型中基因发生扩增或缺失的情况统计; B)各亚型中相应染色体中扩增(红色)与缺失(绿色)的情况5. iCCA亚型甲基化特征:
将L(低改变)组iCCA亚型病人作为参照,首先,Benjamin Goeppert等人通过韦恩图展示LDH组、L组以及M组亚型病人的特异甲基化位点交叠情况(如Fig 5A),并对LDH组与H组高甲基化启动子位置进行统计(如Fig 5B),接下来,针对H组中特定高甲基化位点的基因进行功能富集分析(如Fig 5C), 分析LDH组中高甲基化位点的转录因子的分布情况(如Fig 5D)。接下来,为了进一步描绘iCCA亚型病人的细胞组成,将iCCA亚型病人的甲基化数据与TCGA数据库中的胆癌(CHOL)、肝细胞肝癌(LIHC)和胰腺癌(PAAD)的甲基化数据进行整合,并通过MeDeCom算法对这些样本中LMC2-LMC5中的组成情况进行展示(Fig 5E)。
Fig 5.iCCA亚型甲基化特征.A)LDH组、H组以及M组亚型病人之间特定甲基化位点的韦恩图;B)LDH组与H组高甲基化启动子的富集分析;C)H组中特定高甲基化位点基因功能富集分析;D)在LDH组中高甲基化位点的转录因子分布;E)iCCA、胆癌(CHOL)、肝细胞肝癌(LIHC)和胰腺癌(PAAD)病人中LMC2-LMC5的组成。
参考文献:
1. Banales J M, Cardinale V, Carpino G, et al. Expert consensus document: Cholangiocarcinoma: current knowledge and future perspectives consensus statement from the European Network for the Study of Cholangiocarcinoma (ENS-CCA)[J]. Nature Reviews Gastroenterology & Hepatology, 2016, 13(5): 261-280.
2. Lutsik P, Slawski M, Gasparoni G, et al. MeDeCom: discovery and quantification of latent components of heterogeneous methylomes[J]. Genome Biology, 2017, 18(1).
3. Aran D, Sirota M, Butte A J, et al. Systematic pan-cancer analysis of tumour purity[J]. Nature Communications, 2015, 6(1): 8971-8971.