TMB相关的预后模型的开发和新生物标记物的鉴定
Development of Tumor Mutation Burden-Related Prognostic Model and Novel Biomarker Identification in Stomach Adenocarcinoma
肿瘤突变负担相关的预后模型的开发和新的生物标记物的鉴定在胃腺癌中的应用
发表期刊:Front Cell Dev Biol
发表日期:2022 Mar 23
影响因子:6.081
DOI: 10.3389/fcell.2022.790920
一、背景
胃癌(GC)是第三大最常见的癌症相关死亡病例,其中STAD是最常见的病理组织类型。STAD的病因仍不清楚;许多因素包括幽门螺杆菌感染、吸烟、环境因素、毒物接触史等都与STAD的发生有关。免疫治疗是一种新开发的方法,通过靶向PD-1、PD-L1、CTLA-4等来治疗肿瘤。免疫疗法与常规治疗相结合的一线临床试验显示,胃癌患者的临床获益和生存率有所提高,特别是在预处理的患者中。
以前的研究指出了免疫治疗反应和TMB之间的相关性。肿瘤组织中的基因突变可能通过转录和翻译产生新的抗原,从而被免疫系统识别和锁定。TMB可以作为生物标志物来预测晚期胃癌患者接受免疫治疗后的生存率,这有助于医生做出最佳决策。
二、材料与方法
1、 数据来源
1)TCGA:STAD患者的各种数据,包括突变数据、基因表达谱和临床数据
2)STAD探针矩阵文件(GSE84433系列矩阵)和平台文件(GPL6947-13512)
3)外部验证组(GSE84433)、GSE62254
4)人胃癌细胞系(BGC823,MKN45)
2、 分析流程
1)数据采集:以TMB的中位数为临界值,将STAD样本分为高和低TMB组;使用limma软件包分析高和低TMB组的基因表达数据
2)DEGs富集分析和免疫浸润评估:使用GSEA软件进行基因集富集分析(GSEA),并报告了在高TMB组(与低TMB组相比)富集最明显的前五个GO关键词和KEGG途径;CIBERSORT
3)突变数据的可视化和ssGSEA分析:使用GSVA包在TCGA-STAD样本中进行ssGSEA分析,以确定23个免疫相关基因组的免疫活性;ESTIMATE算法,创建肿瘤微环境;使用ssGSEA方法计算了TCGA数据库中每个STAD样本的肿瘤免疫细胞浸润得分,使用 " Limma "包运行免疫评分和免疫分型的差异分析
4)免疫预后模型的构建和多重验证:通过ImmPort数据库中的免疫相关基因列表与前面的DEGs相交,获得差异表达的免疫基因;变量COX分析、LASSO、多变量Cox回归分析
5)模型基因的突变和CNV:cBioportal网站,选择研究(胃腺癌TCGA PanCancer数据),下载模型基因的突变情况;TIMER
6)免疫治疗效益评估和模型比较:分析了一系列免疫治疗的生物标志物;TIDE数据库,获得每个样本的TIDE、微卫星不稳定性(MSI)、功能障碍和排异评分,研究高风险组和低风险组之间的差异
7)药物敏感度测试:从CellMiner数据库下载了转录组数据和FDA认证的药物敏感性相关数据,以明确预后模型中的模型基因对药物敏感性和耐受性的影响
8)细胞实验:细胞培养和siRNA处理、定量实时PCR、蛋白印迹分析、细胞增殖和菌落形成试验、跨孔迁移和伤口愈合试验
三、实验结果
01 - STAD的主要基因改变和统计分析
应用Maftools对突变数据进行总结,根据变异效应预测器进一步对突变进行分类,其中错义突变的频率最高(图1A)。在所有突变类型中,SNP的发生频率最高(图1B)。同样,STAD中最频繁的SNV类型是C>T转位(图1C)。图D显示了每个样本的突变情况,这与TMB最相关(图1D)。图E也描述了样本的突变情况(图1E)。前10个突变的基因是TTN、MUC16、TP53、LRP1B、ARID1A、SYNE1、FAT4、CSMD3、FLG和PCLO(图1F)。
图1 STAD的主要基因变化瀑布图以图形方式显示了样本的基因突变情况(图2)。相关图直观地显示了两个基因突变之间的相关性;例如,PIK3CA和ARID1A的突变共同出现,而PIK3CA和TP53的突变则相互排斥(图3)。
图2 STAD样本的瀑布图 图3 STAD样本的基因突变之间的相关性根据TMB的中位数,将STAD患者分为两组:高TMB和低TMB。根据KM生存分析,高TMB组患者的生存率高于低TMB组的患者(补充图S1A)。结果显示,在STAD中,TMB与年龄有良好的联系,与分期、T期和N期呈负相关;女性患者的TMB高于男性患者。女性患者的TMB高于男性个体(补充图S1B-H)。在高和低TMB组之间,发现了816个DEGs。
补充图S102 - GSEA富集和免疫浸润分析
使用GSEA富集分析比较高、低TMB组,得到高TMB组中富集度最高的前5个GO关键词(图4A-E)和KEGG通路(图4F-J)。这些KEGG途径和GO关键词大多与遗传物质代谢和DNA修复有关。
图4 GSEA富集的结果根据研究,肿瘤中TMB越高,产生的新抗原越多,使肿瘤更具免疫原性。因此,作者研究了STAD中TMB和免疫标志物之间的联系,使用CIBERSORT确定了浸润的免疫细胞的比例。这些发现表明,高TMB肿瘤包括高比例的滤泡辅助T细胞、激活的记忆型CD4+T细胞、M1巨噬细胞、M0巨噬细胞和中性粒细胞。静止的记忆性CD4+T细胞、调节性T细胞、单核细胞、静止的树突状细胞和静止的肥大细胞在低TMB组中都比较高(图5)。
图5 STAD的高低MB分组间22种免疫细胞丰度03 - 预测模型的构建和验证
将免疫相关基因和先前的DEGs的重叠,得出差异表达的免疫基因。采用一次性随机分组来建立训练组和内部验证组。根据训练组的单变量COX分析,应用LASSO算法来处理21个与生存相关的免疫基因。在逐步进行多变量Cox回归分析后,有四个免疫基因能够形成预测模型。每个病人的风险分数(RiskScore)计算如下:0.001*APOD +0.005*APOH +0.039*INHA +0.499*GLP2R。每个模型基因都被认为具有高风险属性。
作者将训练组、内部验证组、总组和外部验证组的患者分成高风险组和低风险组,在计算他们的风险分数后,进行后期的生存分析。训练组、内部验证组、总组和外部验证组中的高风险组和低风险组的生存曲线明显不同,低风险组的生存率明显大于高风险组的。根据ROC曲线的曲线下面积(AUC)值(图6),建立的预后模型的准确性是可靠的。最终,单变量和多变量的预后研究显示,从模型中得出的风险分数是一个独立于其他因素的预后因素。
图6 存活率曲线和ROC曲线建立模型基因的Boxplots来计算高风险组和低风险组之间的表达水平差异(图7A-D)。高危组的所有模型基因的表达量都明显较高,这验证了先前的推断,即所有模型基因都属于高危因素。此外,在多基因生存研究中纳入所有模型基因,成功验证了预后模型的效率(图7E)。为了提高研究的临床转化意义,成功地设计了一个在线的动态Nomograph App,以快速计算病人的生存率,支持临床决策。
图7 模型基因的多重验证cBioportal网站提供了模型基因的遗传变化的整体视图(图8A),以及领域突变图(图8B-E)。这些模型基因的突变频率极低。
图8 模型基因的突变情况根据TIMER数据库,这些模型基因的CNV对免疫细胞浸润水平差异影响不大(图9A-D),只有巨噬细胞浸润对STAD患者的生存有实质性影响(图9E)。
图9 STAD中模型基因和免疫细胞的CNV作者通过分析风险分类和肿瘤微环境之间的相关性,创建了肿瘤微环境的热图(图10A)和小提琴图(图10B-E)。总之,高风险组的StromalScore、ImmuneScore和ESTIMATEScore高于低风险组,而低风险组的TumorPurity得分更高。为了研究风险分数和免疫状态之间的关系,用ssGSEA方法对23个免疫细胞亚群进行了量化,发现高风险组13个免疫细胞亚群的浸润明显高于低风险组(图10F)。
图10 对肿瘤微环境的免疫状态的检查高危组的TIDE评分较高,MSI评分较低,Dysfunction评分较高,Exclusion评分较高,说明STAD高危组的免疫逃逸潜力增大,导致免疫治疗效果不佳(图11A)。最后,从5年的ROC曲线可以判断,构建的预后模型的AUC值最大,所以其预后预测效率高于TIDE评分和TIS评分(图11B)。上述结果表明,GLP2R高表达组的风险得分最高,预后最差。
图11 免疫治疗的疗效预测和模型比较04 - 药物敏感度测试
通过对预后模型中的模型基因进行单独的药物敏感性分析,作者能够确定具有最显著统计学差异的前16种药物。发现APOD的表达与维莫非尼、pd-98059、达拉非尼、次托霉素、赛鲁米替尼、巴非替尼、地尼罗星diftitox ontak和cobimetinib(异构体1)的敏感性呈正相关,它表明APOD的表达水平越高,对上述药物的敏感性越大,但APOD与吡唑吖啶、巴特林、多西他赛和普拉唑酸呈负相关性。研究发现APOH的表达与艾司洛尔的敏感性高度相关,INHA的表达被发现与氟维司群的敏感性密切相关,但与氨酚烷胺的敏感性成反比。此外,STAD患者中GLP2R的表达越高,患者对地西他滨的敏感性越高(图12A)。为了进一步提高肿瘤突变负担相关预后模型对胃癌治疗的临床价值。分析了临床治疗胃癌的常用药物,其中包括顺铂、多柔比星、吉西他滨、拉帕替尼,发现吉西他滨在高危组比低危组更敏感,而拉帕替尼则相反(图12B-E)。
图12 基因药物敏感性分析05 - GLP2R的下调抑制STAD细胞的增殖和迁移
为了评估GLP2R在胃癌中的具体作用,作者分析了GLP2R在八个胃癌细胞系(GES1、BGC-823、MKN45、SNU-216、SGC-7901、MGC-803、AGS和N87)的相对mRNA表达水平。GLP2R在BGC-823和MKN45细胞系中的表达水平高于其他细胞系(图13A)。首先通过qRT-PCR和Western blot评估了细胞的转染效率,发现在siRNA 3转染后,GLP2R的相对表达水平明显降低(图13B,C)。为了进一步证实GLP2R在增殖中的作用,进行了CCK-8实验来检测GLP2R敲除的效果。GLP2R沉默后,BGC-823、MKN45细胞的增殖与对照组细胞相比明显下降(图13D)。菌落形成实验也表明,GLP2R沉默明显抑制了BGC-823细胞的生长(补充图S4A-B)。进行了转孔和伤口愈合实验来检测迁移,结果显示,用siRNA转染的BGC-823、MKN45细胞的迁移率明显低于对照组转染的细胞(图13E-H)。这些数据表明,GLP2R敲除抑制了BGC-823, MKN45细胞的增殖和迁移能力。
图13 GLP2R基因敲低抑制胃癌细胞增殖和迁移四、结论
本研究结果意味着高TMB的STAD患者有更好的预后。利用TCGA数据库中的STAD样本鉴定了高和低TMB组之间的DEGs,并研究了免疫细胞浸润特征与TMB之间的关系。此外,利用一系列的生物信息学方法建立了免疫预后模型,并进行了多次验证。通过建立动态提名图App在线和基于预后模型的免疫治疗预测,进一步加强了临床转化的重要性。最后,GLP2R可望成为胃癌的一个潜在靶点。