生信科研

胶质瘤双基因预后标志物就能3+了?

2020-03-26  本文已影响0人  科研菌
欢迎关注「科研菌」

今天跟大家分享的是2020年1月21号发表在Jounrnal of Cellular Biochemistry(IF=3.448)杂志上的一篇文章A robust two‐gene signature for glioblastoma survival prediction。文章中作者通过胶质母瘤细胞的生存预测得到了一种可靠的两个基因标记。

A robust two‐gene signature for glioblastoma survival prediction胶质母细胞瘤生存预测的可靠的两个基因标记


一. 研究背景

多形胶质母细胞瘤(GBM)是一种高度恶性的脑瘤,在整个脑实质中广泛传播和转移,无法实现最大程度的手术切除,并导致肿瘤复发是一种致命的疾病。传统上,GBM分为原发性和继发性肿瘤。

本文之所以研究这个课题,是因为GBM是一种异质性疾病,其形态相同的胶质母细胞瘤肿瘤具有不同的临床结果。因此,GBM的组织学分类不能估计预后。尽管临床现在开发了创新的诊断技术和新疗法,但是GBM的预后并未得到明显的改善。

二. 分析流程

分析流程

三. 结果解读

1. GBM数据集的收集

从GEO中获取GSE16011,这里共包含159个GBM样本,从中获得140个包含生存时间与状态的总体生存率(OS)信息的GBM样本的训练数据集;

之后,从CGGA中得到325个包含不同的神经胶质瘤组织学亚型的测序样本,然后将其中的144个GBM病例中的138个作为测试组,并提供相应的生存数据;

再者,从TCGA里得到172个基因表达谱测序样本(167个GBM样本和5个正常组织样本),并筛选获得了165个GBM样本作为独立的验证数据集。

总共从以上三个数据库得到同时包含443例GBM患者的mRNA表达谱和相应的临床数据用于构建和验证模型。其中,GBM患者的中位年龄为55岁(21-89岁),大多数患者为55岁以上的男性。

2. 从训练数据集中获取三组具有不同生存率的GBM患者

首先,作者对GSE16011组进行了单变量COX分析,并鉴定了与OS显著相关的3784个基因集,这3784个基因在火山图中显示为蓝色(图1A),获得了与生存相关的蛋白质编码基因(PCG)。

随后,使用3784个与生存相关的基因,我们执行了tSNE无监督学习算法(即t分布随机邻域嵌入)以减少维数,捕获特征,并使用R中NbClust包进行聚类,发现训练集的患者可以分为三个聚类(图1B,C)。

Kaplan-Meier生存分析显示这三类患者的生存时间不同,生存期最短的患者被称为高危组,生存期相对较短和最长的患者被称为中危和低危组(图1D),筛选出了训练集中基因的预后,更低的风险与更好的OS显著相关。

图1A-D. 在GSE16011数据集中发展了预后两基因标记前期

3. 构建两个基因标记

为了进一步探索涉及将三个不同风险组分类的基因,作者分别提取了高风险和低风险组,高风险和中风险组,中风险和低风险组之间差异表达的基因,在这个比较中作者共发现了16个共表达的差异基因(图1E)。

然后,作者通过构建了2^16–1 = 65535个RS(Risk Score,风险系数)模型来找出这16个PCG的特征,其中包括1到16个不同的基因编号,并进行ROC分析,计算ROC曲线下面积所有这65535个标记,以及具有最大AUC值的标记,确定GRIA2和RYR3两个基因标记(图1F)。

图1E-F. 在GSE16011数据集中发展了预后两基因标记后期

根据GTEx和cbioportal数据库检索,获得人正常组织和癌症组织中基因标志中预后基因表达水平的差异。即与其他组织相比,发现RYR3(图2A,B)和GRIA2(图2C,D)在脑和GBM组织中均高表达。

图2. RYR3(A和B)和GRIA2(C和D)在脑和GBM组织中的表达情况

也是根据GTEx和cbioportal数据库检索,得到这两个基因在脑和GBM组织中高表达(表2)。其中第一行源自训练集中的单变量Cox回归分析,第二行源自Ensembl数据库。

表2. 两个PCG在预后表达特征中的身份以及它们与预后的单变量COX关联

4. 两个基因标记在三个数据集中均有良好表现

根据上面作者构建的风险模型,每个患者都获得了一个RS,根据中位RS将患者分为高危和低危组。

通过Kaplan-Meier生存分析发现,GSE16011(n = 140)、CGGA(n = 138)和TCGA(n = 165)数据集中更低的风险与更好的OS显著相关(图3A-C)。

此外,我们在三个数据集中执行了TimeROC分析,以监控RS模型的一致预测性能,确定了三个数据集中的两个基因标记在GBM具有强大的预测能力(图3D-F)。

图3. 两个基因标记在三组中的存活表现

下图由三个数据集中的两个基因标记分组,直观显示了生存状态、RS以及三个数据的PCG预后表达。对于在三个数据集中具有低RS的GBM时,GRIA2的表达被上调,而RYR3的表达则处于较低水平,反之亦然(图4A‐C)。

图4. 高风险和低风险集群中患者的风险评分分布,生存状态和基因表达模式

5. 两个基因标记预后能力强于现有基因相关标记

利用验证的CGGA数据集,我们进行了Kaplan-Meier生存分析,结果表明GR-Sig(现有的两个基因GRIA2和RYR3的标记)和PRGIT-Sig(现有的五个基因PTPRN,RGS14,G6PC3,IGFBP2和TIMP4的标记)可以将GBM患者分为预后不同的高危组和低危组(图5A-E)。图3B也有体现。

通过ROC特性分析比较两个基因签名和五个现有总体生存三年的特征,得到GR‐Sig在OS三年后的AUC为0.804,这大于其他样本,表明与现有的五个基因相关的特征相比,这些基因特征有较好预测能力(图5F)。

图5. 通过两个基因标记和五个现有的基因相关标记比较存活预测的敏感性和特异性

6. 两个基因标记通过了独立性测试

为了研究标记的预测独立性,在三个数据集中执行了单变量和多变量COX分析。在训练数据集中,多变量COX回归分析表明,依据一定的标准,两个基因的特征独立于性别年龄等临床特征。另外两个数据集也呈现相同的多变量COX分析结果(表3)。

表3. 在三个数据集中对GBM患者的特征和生存进行单变量和多变量COX回归分析

7. GRIA2和RYR3对GBM细胞增殖,迁移和侵袭的影响

为了进一步研究GRIA2和RYR3在GBM中的功能,我们设计了针对GRIA2和RYR3基因的相应siRNA(小干扰RNA),并检测了它们对U87细胞的增殖,迁移和侵袭的影响。

首先,通过qRT-PCR检测siRNA转染后GRIA2和RYR3的表达,si基因组的U87细胞中GRIA2或RYR3的相对mRNA表达低于si-NC(阴性对照)组(图6A,B)。

在通过siRNA干扰GRIA2和RYR3之后,CCK-8分析用于检测细胞增殖的可能变化。结果发现,与NC组相比,当敲除GRIA2或RYR3时U87细胞的细胞活力降低,这表明敲除GRIA2或RYR3可以降低GBM细胞的增殖能力(图6C)。

共聚焦图像通过转染si-GRIA2和si-RYR3后用phalloidin(鬼笔环肽)染色说明了U87细胞中细胞骨架的不同变化(图6D)。

伤口愈合试验用于检测siRNA分别在GRIA2和RYR3敲除约8小时后的迁移变化。与si-NC组相比,用si-GRIA2转染的细胞迁移的细胞数量增加,而用si-RYR3转染的细胞显示的迁移能力较低(图6E)。

通过transwell测定法探究了用si-GRIA2和si-RYR3转染后侵袭的变化。结果表明,与si-NC组相比,si-GRIA2组中侵袭的U87细胞更多,而si-RYR3组中侵袭的U87细胞更少(图6F)。

图6. 转染后U87细胞的细胞活力,迁移和侵袭实验

本文作者干实验为主,用生信分析筛选出了两个基因标记,证明了GRIA2-RYR3与GBM生存率相关,在GBM患者预后的预测中具有明亮的临床意义;最后湿实验验证了这两个基因标记对GBM细胞增殖,迁移和侵袭的影响。

还是和往常一样,后台回复「22a」,即可获取今天小编为大家解读的文献。

本期的文献分享就到这里啦,一起关注「科研菌」,一起期待下期的精彩内容吧

扫上方二维码即可关注科研菌
上一篇下一篇

猜你喜欢

热点阅读