揭示脑辐射毒性相关相关基因、GBM预后和潜在的新治疗靶点之间的相
Brain Radiotoxicity-Related 15CAcBRT Gene Expression Signature Predicts Survival Prognosis of Glioblastoma Patients
脑辐射毒性相关的15CAcBRT基因表达特征预测胶质母细胞瘤患者的生存预后
发表期刊:Neuro Oncol
发表日期:2022 Jul 8
影响因子:13.029
DOI: 10.1093/neuonc/noac171
一、研究背景
胶质母细胞瘤(GBM)是成人中最常见和最致命的原发性脑癌。迄今为止,GBM生存的预后特征主要是通过肿瘤和正常组织之间的差异表达分析,基于GBM的生物学信息,或与其肿瘤微环境相关联来确定的。本研究评估了与BTR(脑辐射毒性)相关的肿瘤转录组是否有助于为GBM患者的生存提供独立的预后,并隐藏着潜在的新型治疗目标。
BRT与特定基因的单核苷酸变异(SNVs)有关,在这项研究中被指定为放射性毒性基因(RGs)。然而,关于这些基因可能对GBM患者预后的影响知之甚少。
二、材料与方法
1、数据来源
1)通过系统回顾确定的与BRT相关的SNVs被命名为R-SNVs,携带它们的基因被称为RGs,基因和R-SNVs之间的对应关系在单核苷酸多态性数据库(dbSNP)中得到了验证;当一个变体位于两个基因之间时,两个基因都被包括在RG列表中,产生了扩展的RG(E-RGs),由RGs编码的蛋白质被命名为放射性毒性蛋白质(RPs)
2)获得以前记录的和新的可能的R-SNVs在墨西哥人群中的频率,在总共2217名墨西哥人中探索了E-RG:来自48个不同民族的1074名美洲印第安人(MA)和1143名混血儿(MEZ),他们都属于DMS1和DMS2队列;将墨西哥人群中R-SNVs的等位基因频率与来自美国加州洛杉矶的墨裔美国人(MXL)、犹他州的居民进行比较
3)使用CGGA数据集对15CAcBRT特征进行外部验证:基因表达和临床数据来自CGGA(ID:mRNA_array_301)
2、分析流程
1)墨西哥人口中发现的新变体的计算结构分析:调查墨西哥人群中发现的新变异体在蛋白质结构域和三维结构上的分布;实验确定的三维结构和理论模型分别从PDB和ModBase数据库中检索出来;用突变三维程序研究变体在蛋白质三维结构中的位置和聚类;使用Structure-PPi系统对变体进行了功能注释,如配体结合位点、催化残基、蛋白质的翻译后修饰和PPI界面的残基
2)与BRT相关的PPI网络的构建:使用STRING来构建与BRT相关的PPI网络;对BRT-PPI网络的搜索节点进行了拓扑学分析;每个聚类的生物功能由BiNGO确定
3)利用GBM-BioDP识别与参与BRT的基因表达相关的新型GBM生存预后图谱:利用GBM-BioDP工具和TCGA的数据,对来自COMT-扩展PPI网络的RGs表达和mRNA编码的蛋白簇进行分析
4)基因型与大脑基因表达的相关性:用ANNOVAR和InterVar对E-RGs的遗传变异和整合15CAcBRT(与BRT相关的COMT+APOE蛋白簇的15个mRNA)分子签名的遗传变异进行了注释,并从1 143名MEZ和1 074名MA人中获得它们在墨西哥人口中的频率
5)富集途径分析和聚集类别分析:使用STRING工具中的KEGG来富集的途径
6)使用CGGA数据集对15CAcBRT特征进行外部验证:根据符合15CAcBRT特征(与BRT相关的COMT+APOE蛋白的15个mRNAs集群)的基因表达水平进行聚类分析;根据热图聚类成员对患者进行分层,以计算Cox回归分析;使用年龄、IDH突变状态、MGMT启动子甲基化状态、化疗治疗和热图聚类进行单变量和多变量分析
三、实验结果
01 - 与BRT相关的功能簇的PPI网络
作者进行了系统的文献综述(补充图S1),确定了36个R-SNVs。29个R-SNVs属于从系统回顾中选出的11个基因(RGs),7个R-SNVs属于从dbSNP中选出的6个基因。APOC1也包括在分析中,这18个基因被命名为扩展(E-RGs):APOE、NECTIN2、APOC1P1、TOMM40、POR、MAT1A、CYP1B1、COMT、ARVCF、TXNRD2、BDNF、BDNF-AS、DTNBP1、MGMT、CEP128、DISC1FP1、KCTD1、和APOC1。
补充图S1 总结文献回顾过程和排除原因的流程图BRT-PPI网络(图1A)由12个节点和17条边组成。全局网络拓扑和统计学测量(图1B)显示,这些蛋白质之间的相互作用明显多于规模相似的随机蛋白质集的预期。这种富集表明,BRT-PPI网络被认为是一个非随机图,这些蛋白质至少在生物学上有部分联系。每个节点的拓扑分析结果显示COMT是该网络中的 "枢纽"和 "瓶颈",从而表明其具有中心调节作用。因此,COMT可能强烈地参与了与BRT有关的细胞过程,或者与连接调节分子有关。有趣的是,在BRT-PPI网络中,与APOE相对应的节点在生物学方面具有第二大的拓扑属性。
接下来,用COMT(BRT-PPI网络的枢纽)及其直接边缘生成COMT-扩展PPI网络,然后用STRING扩展(图1C)。COMT-扩展PPI网络的拓扑特征(图1B)表明,节点的相互作用明显多于预期。基于这些结果,确定了一个与BRT功能相关的蛋白质网络,由Cytoscape可视化的COMT-扩展PPI网络产生了8个集群(图1D),其中7个与以下RPs有关:COMT、APOE、BDNF、MAT1A、DTNBP1、APOC1和CYP1B1。这些簇的前四个生物功能(图1D)与RPs有关,显示这些蛋白是生物活性复合物的一部分(图1D)。
图1 由STRING生成的蛋白质-蛋白质相互作用(PPI)网络02 - 与BRT相关的RGs的表达揭示了与GBM患者生存有关的推测性分子特征
作者使用COMT、APOE、BDNF、MAT1A、MGMT、POR和CYP1B的mRNA表达水平(其余的RGs不包括在该平台中)来确定是否存在任何可能与被诊断为GBM患者的生存有关的转录组谱。对GMB-BioDP(HT_HG-U133A平台)中包括的277名患者的数据进行了分析,详见图2A。利用上述7个基因的mRNA表达谱进行的无监督层次聚类分析显示了两个GBM患者的聚类(A和B)。聚类A与聚类B相比,生存时间明显缩短。聚类分析还确定了三个不同的RGs亚组(图2A)。然而,对这些RGs亚群的分析并没有发现任何对患者生存有影响的预后群。总的来说,本研究结果确定了一个对GBM患者预后有影响的新的分子谱系,称之为7BRT(与BRT相关的七个基因)分子谱系。
图2 作为一个群体,RGs与GBM预后的BRT分子谱有关03 - 7BRT分子图谱基因编码的蛋白质中的SNVs的三维集群包括与癌症生物学有关的假定致病变体
作者研究了墨西哥人群中E-RGs的蛋白质序列和三维结构中的新型变异体的分布。根据结构分析,在APOE、COMT、CYP1B1、MGMT和POR中发现了含有至少三个变体的球体的三维集群,直径为15-30埃(图3),根据Structure-PPI系统对确定的变体进行功能注释。在APOE的结构分析中发现了一个簇(直径=17.78埃,P值=0.080),包含变体p.V140M、p.G145D和p.R154S(图3A)。这些变体位于对蛋白功能有有害影响的热点区域,并含有来自其他疾病的致病变体。
对于COMT,确定了一个簇(直径=24.16埃),包含变体p.A72S、p.E84K、p.A102T、p.R125C、p.R128H和p.V158M(图3B),位于影响PPI的二聚体界面。p.A72S变体与酶的活性降低有关,被认为是精神分裂症26,27以及肺癌和乳腺癌(COSM6354285)的危险因素。p.E84K被鉴定为肺癌(COSM2892544),而p.A102T在ClinVar中被列为良性。p.V158M与酶的低活性和热敏性28有关,并在肺癌、胰腺癌和结肠直肠癌中被确认(COSM4997949)。p.V158M与药物反应、帕金森氏病和精神分裂症谱系障碍有关。
在CYP1B1中(图3C),只确定了一个簇(直径=18.08埃),它包含变异体p.V432L、p.A443G和p.N453S。在结直肠癌中发现了体细胞变体p.N453S(COSM1408011)。
在MGMT中(图3D),发现了另一个有五个变体的簇(直径=21.03埃)。这些变体是:p.V81M、p.L84F、p.S93L、p.L142I和p.I143V。尽管所有这些变异在ClinVar数据库中没有注释,但在肺癌(COSM6461010)、结直肠癌(COSM6712349)和胃癌(COSM8554441)中已经发现了81位的MGMT变异,并有不同的变化。此外,相邻位置的体细胞变异与GBM(A82V,COSM2151781)以及其他类型的癌症有关。
在POR中,确定了三个不同的聚类。聚类1(直径=20.99埃)包含变体p.T372M、p.I444Hfs*6和p.V492M,没有来自ClinVar数据库的任何注释(图3E);聚类2(直径=28.26埃)包含变体p.P469A、p.V472M、p.A503V、p.I544L和p.D575N;第3簇(直径=29.97埃)包含变体p.V85M、p.R107H、p.D165A、p.G213E、p.V230M、p.E232G和p.R406C。这最后两个群组中的变体与不同类型的癌症有关。
图3 在墨西哥人口中发现的新变体在蛋白质序列和三维结构上的映射情况04 - COMT和APOE RPs功能群揭示了一个与GBM患者预后相关的新的和稳健的基因表达谱
作者分析了从COMT-扩展PPI网络中得到的蛋白群以及它们之间的组合。只有COMT和APOE蛋白簇显示出明显的预后价值(图4A)。为此,结合COMT和APOE蛋白簇,利用GMB-BioDP门户网站(n = 277名患者)评估其在GBM患者中的预后潜力。,确定了两组患者的生存期有显著差异(图4B),A组和B组的中位总生存时间分别为13.5和33.3个月。
此外,根据GBM分子亚型(C:经典型,M:间质型,P:骨髓型,N:神经型)进行分层生存分析,也能确定集群A和B之间的生存差异(图4C-E)。总的来说,无论GBM分子亚型如何,多基因表达水平较低(截止值<中位数)的患者生存期更长。综上所述,数据表明与BRT相关的COMT和APOE蛋白簇的相互作用代表了一个新的特征,在GBM中具有强烈显著的预后价值。新开发的分子特征被命名为15CAcBRT(15个与BRT有关的COMT+APOE蛋白簇的mRNAs),包括:APOE、COMT、APP、MAOB、PCSK9、MAOA、IL6、APOA1、APOA5、DDC、DBH、ALB、APOA2、AHSG和APOB。
此外,确定COMT和APOE蛋白簇,由COMT-APOE和MAOB-APP蛋白相互作用连接(图4F),在所有GBM分子亚型中都有增加。用Cox模型多变量分析生存率,记录了15CAcBRT分子特征与GBM-BioDP中进行的MGMT启动子甲基化状态无关。此外,发现参与15CAcBRT特征的E-RGs和基因的大脑表达水平受到R-SNVs的影响,其中COMT_rs4680和MATIA_rs7087728被描述为eQTL。
图4 与BRT相关的COMT和APOE蛋白簇呈现出GBM的新预后特征作者从CGGA门户网站获得了mRNA_array_301的微阵列数据集,使用GBM-BioDP的多基因生存分析的相同方法,在不同血统的队列中验证了15CAcBRT签名。与以前的结果相似,该分析显示了三个不同的GBM患者群(第1组,n = 23;第2组,n = 83;和第3组,n = 2),第1组与第2组和第1组与第3组之间存在明显的生存差异(补充图S6A 和B)。此外,在最具侵略性的分子亚型(古典型和间质型)中,发现基因表达谱较低的患者预后较好,这与GBM-BioDP队列的结果一致(补充图S7A和B)。多变量Cox回归分析证实,在考虑了混杂的协变量,如年龄、MGMT启动子甲基化状态、IDH突变状态后,15CAcBRT签名的第2组成员是生存的独立预测因素。有趣的是属于15CAcBRT签名的IL6、APOA5、APOA1、APOA2、APOB、APOE、DCC、MAOB和PCSK9基因,当患者按热图聚类成员分层时,显示出组间基因表达水平的显著差异(补充图S6C)。此外,这个特征能够预测接受化疗的病人的生存概率增加(补充图S7C和D)。
补充图S6 15CacBRT预后分子特征对GMB患者生存的验证 补充图S7 CGGA队列中按分子亚型和15CacBRT特征分类的GMB患者的生存率05 - 与BRT相关的基因在功能上与癌症和神经退行性疾病的途径有关
为了更好地了解BRT所涉及的分子机制,作者对与BRT相关的PPI网络的巨型组件进行了功能富集分析。为此,生成了BRT-PPI和COMT-Extended-PPI网络的巨型组件。它们的全局拓扑学和统计学测量(图1B)表明,这些巨型组件可以用于功能富集分析。在COMT-extended-PPI网络的巨型成分中,癌症相关的途径占大多数(38%)(图5A,红条)。然而,神经退行性疾病在巨型组件BRT-PPI网络中占主导地位(50%),其中阿尔茨海默病、亨廷顿病和帕金森病是最相关的(图5B,红条)。
与巨型成分BRT-PPI网络相关的人类疾病被巨型成分COMT-扩展PPI网络所覆盖。有趣的是,COMT-扩展PPI网络将神经退行性疾病与癌症途径联系起来(图5A和C)。
图5 与BRT相关的PPI网络的巨型组件的路径富集四、结论
本研究结果表明,与BRT相关的基因对GBM患者具有临床意义。与BRT相关的15CAcBRT签名在GBM患者中具有预后生存价值,并具有药物重新定位和精准医疗的潜力。使用KEGG途径富集分析证明了RGs、神经退行性疾病和癌症之间的关系。含有R-SNVs的RGs编码的蛋白质(APOE、COMT、CYP1B1、MGMT和POR)的三维集群以及与BRT相关的推定致病变体可能是神经肿瘤学靶向方法的一个相关部分。