多组学分析探究m7G修饰对肿瘤预后影响(IF8+)
Identification and Verification of m7G Modification Patterns and Characterization of Tumor Microenvironment Infiltration via Multi-Omics Analysis in Clear Cell Renal Cell Carcinoma
识别和验证透明细胞肾癌的m7G修饰模式,并通过多组学分析确定肿瘤微环境浸润的特征
发表期刊:Front Immunol
发表日期:2022 May 3
影响因子:8.786
DOI: 10.3389/fimmu.2022.874792
期刊相关信息一、背景
肾细胞癌(RCC)是全球10种最流行的癌症之一。透明细胞肾细胞癌(ccRCC)是最常见的组织学类型,占所有RCC病例的75%以上,它的特点是侵袭性生长、高转移率和不良后果。此外,ccRCC的转移是导致癌症相关死亡和治疗失败的最主要原因。
由于RNA的表观遗传修饰在调控各种生物活动中的重要作用,它已受到广泛关注。在真核细胞中,超过170种转录后的RNA修饰已经被确认。作为最常见的修饰之一,N7-甲基鸟苷(m7G)出现在转移RNA(tRNA)、微RNA、核糖体RNA(rRNA)、mRNA的5′帽和内部区域。
二、材料与方法
1.数据来源
1) 从长征医院(中国上海)收集了50对ccRCC和邻近的非癌症组织以及70个ccRCC组织的队列
2) 癌症基因组图谱(TCGA)中的标准化表达数据、DNA甲基化、TMB和临床数据来自UCSC Xena数据集
3) ccRCC的CNV和体细胞突变数据来自GDC门户网站
4) 日本肾癌队列的基因表达和临床信息,从phs002252.v1.p1下载
5) David等人提供的ccRCC单细胞队列数据集,其中包括不同阶段的肾癌组织和正常组织,共164722个单细胞,PRJNA705464的ccRCC单细胞RNA序列数据从GEO数据库中获得
2.实验流程
实验流程图三、实验结果
01 - 拷贝数变异和序列突变导致了癌症中m7G调节器水平的失调
为了全面了解m7G在癌症中的调控模式,作者探索并验证了m7G调节因子在泛癌症中的mRNA表达。结果显示,m7G甲基转移酶,如METTL1和WDR4,在广泛的癌症中上调,而RNA结合和脱帽酶(NUDT4、NUDT16和NUDT10)则明显下调(图S2A)。用两种方法计算了TCGA-ccRCC表达矩阵中m7G相关基因的相关性,包括Spearman(右上)和Pearson(左下)相关检验,结果表明多个基因的表达模式具有明显的相关性(图S2B)。接下来,确定了转录物水平与患者结局之间的关联(图S2C),这表明m7G调节器的表达紊乱对癌症的发展产生了不可忽视的影响。
图S2 m7G调节器在癌症中调节失调为了进一步探讨这些m7G相关基因发生变化的原因,作者验证了癌症中的拷贝数变异(CNV),并观察到CNV和mRNA表达之间存在明显的正相关关系(图1A)。如图1B所示,METTL1、NCBP2和NSUN2经常是杂合扩增,但NUDT10和EIF4E3是显性杂合缺失。相比之下,同型扩增和缺失发生的频率非常低。m7G调节器的CNV改变在染色体上的位置显示(图1C)。在ccRCC中,观察到EIF4E1B、LARP1、GEMIN5和DCP2的CNV增益,而EIF4E2和EIF4G3主要有CNV缺失的频率(图1D)。作者还分析了m7G基因在某些肿瘤类型中(包括UCEC、SKCM、COAD、STAD、LUAD、LUSC和BLCA)的突变情况,发现其中大多数发生突变(图1E)。结果表明,转录失调和DNA序列的改变都可能影响癌症中的m7G基因。
图1 CNV和序列改变导致了m7G-调节器水平的异常02 - 通过对ccRCC中的m7G调节器进行共识聚类,确定了三个聚类
根据m7G调节器的水平,作者采用无监督聚类方法将TCGA-ccRCC样本分为不同的分子亚型。如图2A-D所示,将ccRCC分为三个不同的亚型,即m7G-相关的癌症亚型1(MGCS1)、MGCS2和MGCS3。这种分型方法的临床意义是通过比较三种主要的m7G修饰亚型的临床病理特征和临床结果(图2E,F)来评估的。与其他两个亚组相比,MGCS3的患者表现出特别突出的生存优势。大多数与m7G相关的基因在MGCS2中明显下调(图2G)。
图2 识别ccRCC的m7G亚型为了进一步描述每个病人的分布特点和潜在结构,将每个病人放到一个Sparse Merkle Tree的流形中,以确认ccRCC的风险分布。ccRCC患者被清楚地分成三个群组,并显示出不同的状态(图S3A,B)。同时,单个患者的轨迹分析和伪时间排序显示了风险过渡轨迹(图S3C)。
图S3 每个亚组内的风险状况和组内异质性03 - 不同m7G修饰模式中的功能富集分析
然后,进行了关于代谢相关特征的GSVA分析。在MGCS1中观察到代谢状态的抑制,MGCS1中代谢状态包括糖原代谢、嘌呤代谢、脂肪酸降解、丙酮酸代谢、糖酵解、葡萄糖生成、氧化磷酸化、谷胱甘肽代谢、酪氨酸代谢和视黄醇代谢被抑制。相反,这些特征在MGCS2中大部分被激活,表明代谢活跃的状态(图3A)。一致的是,通过GSVA分析,缺氧相关的特征在MGCS2中被富集(图3B)。此外,在MGCS2中,m6A修饰相关的特征被明显抑制,表明m7G和m6A之间存在潜在的联系(图3B)。
为了进一步研究转录组的差异,我们使用R包RTNduals从获得的肾癌相关转录因子列表中分析了m7G亚型特异性转录因子的调节子,由于调节子活性与m7G亚型密切相关,为三分类的生物学相关性提供了强有力的支持(图3C)。ZEB2在MGCS2组中表现出最低的活性,表明该亚型的EMT过程受到了抑制。这些结果表明,m7G修饰具有调节生物功能的功能。
图3 MGCS1、MGCS2和MGCS3亚群的功能富集分析04 - 3个亚群特异性免疫浸润特点
为了描述免疫状态,作者用GSVA分析比较了各亚组免疫相关过程的富集分数。作者发现MGCS2组的趋化因子、趋化因子受体、免疫抑制剂和免疫刺激因子有下调的趋势。然后研究了三种m7G修饰模式中TME浸润细胞类型的组成,结果显示,与MGCS1和MGCS3相比,MGCS2表现出免疫细胞浸润减少(图4A)。因此,推测MGCS2可以被归类为免疫缺失表型,以抑制免疫力为标志。与上述生存结果一致的是,与MGCS3相比,MGCS2的患者表现出相匹配的生存劣势。接下来关注的是抗癌免疫反应,它可以被总结为一系列的步骤性事件。MGCS2中许多步骤的活性较低,包括癌细胞抗原的释放,癌抗原的呈现,CD4 T细胞、CD8 T细胞和Th1细胞的招募(图4B)。此外,MGCS2的基质评分和ESTI-MATE评分在显著较低。这些结果表明,不同的免疫模式与m7G修饰相关。
图4 识别免疫景观05 - 3个亚型肿瘤体细胞突变和CNV的特征
这里分析了三组中体细胞突变的分布差异。图5A-C显示了前20个频繁突变的基因,MGCS3亚型呈现出比MGCS1和MGCS2组低的突变率。此外,根据突变数据利用DGIdb数据库和maftools软件包中的药物相互作用研究了潜在的治疗靶点。三种不同的m7G修饰模式的可药用基因分别被分为14、19和17类,包括临床可操作、可药用基因组、肿瘤抑制因子、组蛋白修饰等(图5D-F)。还使用R软件包maftools评估了三组中肿瘤相关通路的罕见体细胞改变,包括RTK-RAS、Hippo、WNT、PI3K、NOTCH、MYC、NRF2、TP53、TGF-β和Cell_Cycle。在MGCS1中,NRF2和PI3K途径容易受到影响,而TGF-Beta和PI3K是MGCS2中受影响最大的致癌途径。在MGCS3中,TP53和NRF2是最容易受影响的致病途径(图5G-I)。
图5 亚群间体细胞突变的景观在三个集群中比较CNV的差异。MGCS2显示出最高的CNV率,其次是MGCS1和MGCS3。用GISTIC 2.0解码各组染色体上的扩增和缺失区域,增益/缺失百分比和GISTIC得分显示出类似的模式。这些结果表明,不同的CNV事件可能导致了这三种亚型的形成。
06 - 3个亚型肿瘤药物敏感性
为了进行药物敏感性分析,作者从GDSC数据库中收集了药物反应数据(由IC50值定义)。发现大多数药物在MGCS2组表现较差(图6A)。同时,预测MGCS2对利希替尼和吉非替尼更敏感:帕唑帕尼、伊马替尼、阿西替尼和替米罗莫斯对MGCS1表现出比其他组更好的效果,而舒尼替尼和克唑替尼在MGCS3表现出更好的性能(图6A)。进一步确定了138种小分子药物可以作为ccRCC的可能治疗方法,图6B中描述了在这些组中差异最明显的前10种潜在药物。MGCS1组对Embelin、IPA.3、BAY.61.3606、Vinorelbine、ATRA和QS11敏感,而MGCS2组对Lapatinib和GNF.2有更好的反应,MGCS3组对Shikonin敏感。接下来试图探索对致癌过程有作用的可能药物,使用CellMiner数据库评估了m7G调节器表达和药物敏感性之间的关联。发现CYFIP1的表达与苯达莫司汀、XK-469、依托泊苷、替尼泊苷、缬氨酸、表柔比星和伊美尚的IC50呈反比关系,这表明这些药物对CYFIP1高表达的患者有用。此外,伏立诺他或奈拉滨可能分别适合于SNUPN或DCP2低表达的患者。
图6 药物敏感性的比较07 - 使用外部数据集验证亚型划分模型的稳健性
为了进一步评估分子亚型划分模型的可靠性,作者使用了来自GDSC肾癌细胞数据库和日本队列的两个外部数据集进行验证。对于肾癌细胞,这种分组方法显示了三个亚型之间的显著差异(图S7A)。比较了亚型内药物反应的曲线下面积(AUC),发现GSK690693、THZ-2-102-1、TUBASTATIN A、ZM-447439、BRIVANIB、FILANESIB、GDC-0941和SN-38的AUC在MGCS2肾癌细胞中明显最低(图S7B )。使用最近的模板预测(NTP)算法,从TCGA-ccRCC中确定了亚型特异性特征,将日本队列分为三组(图S7C)。属于MGCS2组的ccRCC患者的生存率比MGCS1和MGCS3要差(图S7D),与以前的生存数据一致。这些结果证实了分类模型的可靠性和稳健性。
图S7 在外部数据集中验证m7G相关的亚型08 - 五个m7G相关基因风险模型的构建和验证
由于三个亚型保留了独特的临床结果和生物功能和免疫景观的异质性,作者随后利用每个基于亚型的特征来构建风险模型。进行了单变量Cox回归分析,寻找对OS有影响的基因(图7A),随后使用随机森林监督分类算法进一步筛选出10个基因(图7B)。为了建立最佳的风险模型,使用K-M分析,比较所有风险模型的P值,最后筛选出由五个基因(PDIA2、OR4C6、SFRP5、BARX1和GJB6)组成的风险特征(图7C):m7Sig风险得分=4.847704*PDIA2+2.849162*OR4C6+4.805007*SFRP5+6.693172*BARX1+4.046870*GJB6。为了验证应用于生存预测的风险特征,TCGA-ccRCC(图7D)和日本队列的患者都以m7Sig评分的中位数为分界标准,被分为高风险组和低风险组。存活率的比较表明,高风险组患者的预后明显比低风险组差(图7E,F)。ROC曲线下的面积被用来衡量m7Sig评分模型的特异性和敏感性(图7G)。该m7Sig评分模型的预测价值也在日本队列中确定。这些结果表明,m7Sig评分可以应用于ccRCC患者的预后评估。
图7 m7Sig模型的构建和验证09 - 单细胞分析
为了确定m7G在ccRCC的TME中的作用,作者接下来从David的研究中获得单细胞序列数据。总共分析了该数据集中的164722个单细胞转录组。然后,使用t分布的随机邻居嵌入(t-SNE)来分类和可视化所有细胞的分布和异质性(图S9A)。值得注意的是,E1F4A1是ccRCC所有细胞群中m7G基因中最重要的各种表达基因(图S9B)。这些细胞也根据肿瘤分期进行了分类(图S9C)。可以发现EIF4A1的表达随着肿瘤分期的进展而升高(图S9D)。这些结果表明EIF4A1可能参与ccRCC的进展。
图S9 ccRCC的单细胞分析鉴于EIF4A1在肿瘤进展中的潜在作用,作者比较了EIF4A1在肿瘤和配对的邻近组织中的表达,发现EIF4A1在ccRCC中的水平明显增加(图8A)。然后探讨了EIF4A1在ccRCC恶性肿瘤中的作用,发现EIF4A1突变状态与B细胞、CD8+T细胞、CD4+T细胞、巨噬细胞、中性粒细胞和树突状细胞的免疫浸润水平有关。在ccRCC中,基于MEXPRESS的分析表明,EIF4A1水平与临床病理特征有关,包括初始治疗后的复发、TNM分类、肿瘤分期、样本类型、吸烟史和总生存期(图8B)。UALCAN结果表明,EIF4A1蛋白水平在ccRCC中上调(图8C),这也与ccRCC的癌症分期和肿瘤等级显著正相关(图8D,E)。为了进一步验证这一结果,收集并检查了ccRCC和配对的正常肾脏组织中EIF4A1的水平。RT-qPCR检测和IHC染色显示,与邻近的正常肾组织相比,EIF4A1在ccRCC组织中的水平明显升高(图8F,G)。此外,在本研究ccRCC组织中,EIF4A1的表达随着肿瘤阶段的进展而增加(图8H,I)。
图8 EIF4A1在ccRCC中的上调情况四、结论
这是第一个探索m7G在ccRCC中的作用并确定三种m7G相关的ccRCC亚型的研究。根据不同的m7G修饰模式,对临床特征、生物功能、免疫浸润、基因组特征和药物反应性进行了全面的评估。本研究还构建了一个强大的m7G风险模型来预测ccRCC患者的预后,m7G和ccRCC之间的关系提供了新的见解,这可以指导临床决策。