文章套路NGS

肿瘤拷贝数+甲基化分型预后分析方案

2020-06-10  本文已影响0人  概普生信

好久好久没给大家分享aging的文章了,虽然期刊被说的不怎么样,但是也有靠谱的文章。今天就跟大家分享的是最近发表在aging-us上的一篇文章,影响因子5.515。

Integrative analysis of genomic and epigenetic regulation of endometrial cancer

子宫内膜癌的基因组和表观遗传调控的综合分析

 

首先让我们通过摘要了解一下这篇文章的主要内容,子宫内膜癌(EC)的特征是DNA拷贝数高和DNA甲基化变异。在这里,作者试图通过分析整合的基因组和表观遗传分析来全面探索这两个因素对EC的发展和进程的影响。作者发现EC中有高DNA拷贝数和DNA甲基化异常,具有6308个拷贝数变异基因(CNV-G)和4376个甲基化基因(MET-G)。作者使用这些CNV-G和MET-G对样本进行分类以进行预后分析,并确定了三种分子亚型(iC1,iC2,iC3)。此外,亚型表现出不同的肿瘤免疫微环境特征。对其分子特征的进一步分析揭示了三种潜在的预后标志物(KIAA1324,NPR1和IHH)。这三个标记均显示出不同的CNV,DNA甲基化和基因表达谱。作者对这三种亚型中的突变进行分析后发现,iC2的突变少于其他亚型。相反,iC2的CNV水平明显高于其他亚型。总的来说作者对基因组和表观遗传学特征的全面分析确定了三个预后标记,并为EC的多层病理学提供了新的见解。

.材料和方法

1.1数据收集和预处理

作者从TCGA中下载了EC中最新的临床随访信息,还有CNV,甲基化,RNA-seq数据和SNP数据并进行了预处理。

1.2识别CNV-GMET-G

作者对CNV和表达谱(RNA-seq)以及甲基化和表达谱分别计算了每个基因的Spearman相关系数。然后使用公式ln(1 + r)/(1-r)将这些系数转换为z值。将p <1e-5的基因定义为CNV-G和MET-G。

1.3识别CNV-GMET-G的分子亚型

为了进一步探索CNV-G和MET-G表达与临床表型之间的关联,基于NCN-G和MET-G基因集的表达谱,使用NMF方法对样本进行聚类。其中NMF是一种无监督的聚类方法,可以用于基于基因组学来识别肿瘤的分子亚型。

1.4  识别分子亚型

作者使用R软件包“ iCluster”进行多组数据集成聚类分析,并整合CNV-G基因的拷贝数变异(CNV)数据,MET-G基因的甲基化数据(MET)以及 CNV-G和MET-G中基因的表达谱数据(EXP)。考虑到CNV-G和MET-G鉴定的分子亚型的数目,选择2-4作为聚类K的数目。

1.5分子亚型与肿瘤微环境的关系

作者使用TIMER来估计六种免疫细胞的丰度,即:B,CD4 T,CD8 T以及中性细胞,巨噬细胞和树突状细胞,在不同的分子亚型中分析了肿瘤微环境中这些细胞的丰度。

1.6分子亚型的遗传差异分析

为了探究分子亚型之间基因表达的差异,作者使用DESeq2 工具,使用2倍差异和FDR <0.05作为阈值来鉴定分子亚型之间差异表达的基因。

1.7分子亚型与肿瘤基因组变异之间的关系

为了评估分子亚型之间基因组变异的差异,作者从TCGA下载了SNP数据,然后删除了内含子和沉默突变。然后,使用Fisher精确检验来比较两组样本之间突变的差异。使用p <0.05的阈值来鉴定突变的基因。

1.8功能富集分析

作者使用R包cluster  profiler对基因进行了GO和KEGG富集分析。

1.9统计分析

使用Kaplan-Meier来评估亚型预后的差异,同时进行单因素生存分析以评估总体生存使用对数秩检验来检验预后差异,显著性p <0.05。所有分析均在R软件3.4.3版中进行。

二.结果展示

作者确定了总共6308个拷贝数变异基因(CNV-G)和4376个甲基化基因(MET-G)。z值分布的分析表明,CNV-G与相应基因表达谱之间的相关性明显向右移动,而MET-G与相应基因表达谱之间的相关性显著向左移动(图1A)。使用以95%置信区间进行Fisher z转化的进一步分析,发现DNA拷贝数的正相关基因 signature(CNV-G,n = 521)和DNA甲基化的负相关基因signature(MET-G, n = 437)。CNV-G和MET-G只有229个基因重叠,这表明CNV-G和MET-G转录失调是相互排斥的(图1B)CNV-G和MET-G基因表现出区域性的基因组偏好,并且大多位于19号染色体上(图1C,1D)。此外,MET-G主要是蛋白质编码基因(图1E),而MET位点主要位于CpG岛(图1F)。

图1. CNV-G和MET-G特征谱

2.1基于CNV-G和MET-G基因的分子亚型

接下来,作者确定CNV-G和MET-G基因的表达谱是否可以预测预后。聚类分析显示CNV-G和MET-G的最佳聚类数均为4(图2A和2B)。Kaplan-Meier(KM)图显示了总生存期(OS),各组之间的预后结果存在显著差异(图2C和2D)。此外,CNV-G和MET-G的四个子类之间存在显著重叠(图2E,2F)。

图2. 基于CNV-G和MET-G基因的分子亚型

2.2将CNV、MET和EXP数据集集成起来进行聚类分析

为了优化聚类,作者在K = 2和K = 3中重复了20次聚类。结果表明,rank = 2(3类)比rank = 3(4类)更稳定。最终iCluster被聚合为三个子类:iC1(95个样本),iC2(128个样本)和iC3(198个样本)。根据iCluster的CNV水平分布,发现iC2中的CNV高于iC1和iC3(图3A),而甲基化水平在各组之间是相当的(图3B)。KM生存分析表明,三组之间的OS有显著差异(图3C)。三组之间的进一步比较显示出iC1,iC3和iC2亚型之间的预后显著不同(图3D,3E)。但是,iC1和iC3亚型之间的预后没有显著差异(图3F)。

 图3.聚类分析

2.3 DNA拷贝数异常与甲基化异常一致

为了研究CNV与MET异常之间的关系,作者将CNV的β值> 0.3定义为CNV扩增。β值<-0.3作为缺失; MET的β值> 0.8表示为MetHyper(超甲基化); β值<0.2表示MetHypo(去甲基化)。作者计算了每个样本的CNV扩增,缺失,MetHyper和MetHypo的数量,发现扩增,缺失和MetHypo之间具有显著相关性(图4A,4C),与MetHyper无关(图4B)。此外,尽管两者均与MetHypo显著相关(图4E),但Loss和MetHyper之间没有显著相关性(图4D)。MetHyper和MetHypo显示出很强的负相关性(图4F)。

图4

2.4分子亚型中肿瘤微环境的特征

作者根据多组数据将EC分为三个亚组,然后比较iC亚型在阶段,等级,年龄和BMI方面的临床特征差异。结果显示,在具有不同临床特征的样本中,iC亚型的分布存在显著差异(表1)。

 表1. EC亚型之间的临床特征比较

接下来作者使用TIMER来比较这三种亚型的免疫评分,发现与其他亚型相比,iC2亚型中有六种免疫细胞评分较低,并且预后最差(图5A,5B),这表明 iC2亚型可能代表一种免疫抑制状态。对比分析进一步显示,与其他亚型相比,iC2亚型的巨噬细胞调节和淋巴细胞浸润评分显著降低,而iC2中与伤口愈合和炎症(IFN-γ反应)相关的评分显著高于其他亚型(图5C) 。这进一步表明免疫状态可能会影响EC的预后。

图5

2.5亚型的分子特征

根据iCluster的结果,作者比较了iC1 / iC3和iC2之间的差异表达基因(DEG)。在三组中共识别了207个DEG。GO分析表明这些基因显著富集于与免疫有关的terms。iC2中207个DEG的CNV频率显著高于iC1和iC3,这表明CNV影响了EC的预后(图6A)。但是在分子亚型之间的甲基化水平没有差异(图6B)。表达水平、甲基化和CNV之间的相关性显示去甲基化样本中DEGs的高表达(图6C),但是在CNV中没有观察到。这表明甲基化对DEGs表达的影响强于CNV对DEGs表达的影响。

 图6

接下来作者进行了单变量生存分析并确定了24个与预后显著相关的基因。作者还分析了三个基因的表达:KIAA1324,NPR1,IHH与甲基化和CNV之间的关系。结果显示这些基因的表达与其甲基化状态之间存在显著的负相关性,但在CNV中却没有(图7)。

图7

2.6分子亚型的突变谱

作者进一步绘制了各种分子亚型的突变谱图,以鉴定iC亚型中差异表达的基因。使用Fisher检验,获得了总共48个基因。突变谱分析显示,iC1 / iC3亚型中PTEN,ARID1A,CTNNB1的突变频率显著低于iC2亚型,预后较好。此外,亚型iC2中的突变频率显著高于iC1 / iC3中的突变频率(图8A)。总体而言,与iC1 / iC3相比,iC2中的沉默/非沉默突变和新抗原更少(图8B)。但是,iC2中CNV的数量显著高于iC1 / iC3(图8C),这表明基因拷贝数变异对预后的影响要强于基因组突变。另外,甲基化的MetHyper / MetHypo水平在分子亚型之间有显著差异(图8D)。

 图8

好啦,今天的分享就到这了~内容超多吧,研究通过基因组学,表观遗传学和转录组学的多组学数据分析联合预后、免疫浸润、突变成功评估了EC的可能发病机制,并证明CNV和甲基化在EC中起重要作用。

上一篇下一篇

猜你喜欢

热点阅读