生信数据分析| 肿瘤免疫细胞研究思路
质瘤是最常见的原发性中枢神经系统恶性肿瘤,据美国脑肿瘤注册中心统计,胶质瘤约占所有中枢神经系统恶性肿瘤的80%。这是一篇来自中南大学湘雅医院研究人员今年8月发表在Computational and Structural Biotec(IF:7.272)上的一篇关于胶质瘤中巨噬细胞的分子特征的文章。
胶质瘤患者肿瘤免疫微环境中巨噬细胞的分子特征
研究背景
胶质瘤按照肿瘤细胞的形态学划分可分为星形细胞瘤、神经节细胞瘤、少突胶质细胞瘤和室管膜瘤等。按肿瘤细胞在病理学上的恶性程度来区分的话,胶质瘤目前最常用的分级是WHO分级,从低到高分为1-4级,1级恶性程度最低,预后最好,4级恶性程度最高,预后最差。
巨噬细胞的活化在炎症和疾病进展中起着至关重要的作用。根据其功能和活化作用对巨噬细胞进行分类的话,一般可以分为两种亚型:经典活化的M1巨噬细胞和替代活化的M2巨噬细胞。M1巨噬细胞由脂多糖和干扰素γ等诱导,其抗原递呈活性强,分泌促炎细胞因子多。M2巨噬细胞常被IL-4,IL-10,IL-13,CSF-1和TGF-β激活,与组织重塑、血管生成和过敏反应有关。肿瘤相关巨噬细胞(TAM)是肿瘤微环境(TME)的组成部分,占胶质瘤非癌细胞的50%,促进肿瘤进展和转移。从严格意义上说,TAM并不被认为是巨噬细胞中的一个亚群,因为这些细胞不是在稳态条件下存在,而是在许多肿瘤中被观察到的。此外,巨噬细胞可以穿过血脑屏障,可以用于抗癌药物的载体。
数据队列
TCGA队列:672个LGG和GBM 的RNA-seq数据和对应的临床信息
CGGA队列:两个RNA-seq队列(CGGA325和CGGA693)和一个微阵列队列(CGGAarray)
单细胞队列:GSE138794
其他:15个确诊为胶质瘤的患者样本
研究流程图
结果
1.将巨噬细胞密度确定为潜在的预后标志
研究人员首先想通过利用WGCNA分析来筛选与巨噬细胞相关的基因以确定胶质瘤中巨噬细胞的预后价值。他们提取了TCGA队列中的表达量前5000个基因用于WGCNA分析,得到了七个模块,从中提取出945个与巨噬细胞模块相关的基因用于后续分析。利用聚类分析算法——PAM算法,可以将TCGA队列中具有相应基因表达特征的胶质瘤患者分为两类(图1A)。同时,利用PCA可以将TCGA数据集区分开来(图1B)。在图1C中的生存分析可以发现cluster1比cluster2的生存明显差。之后在CGGA队列中分析表达谱,从这些基因中验证鉴定出434个基因(图1D)。然后选取最佳阈值(图1E),筛选出13个基因可以很好的区分样本(图1F)。这些基因已被报道在肿瘤中起重要作用,如TIMP1和EMP3与肿瘤中的巨噬细胞招募有关。因此,推测这13个基因可以被作为巨噬细胞特征的可靠鉴别标记。
图1. M2巨噬细胞相关簇的构建与验证2.基于巨噬细胞分类的集群的临床特征和 TME 特征
研究人员接着研究了上述分类中的两个集群的TME特征。在图2A中展示了64种类型细胞在两个集群的表达差异,可以发现成纤维细胞、巨噬细胞和单核细胞等在cluster1中明显增多,其生存也更差。通过TCGA队列分析发现cluster1中的ESTIMATEScores, ImuneScores 和 StromalScores都高于cluster2(图2B)。同时还比较了两个集群的与抗原递呈、细胞表面受体等相关的一些免疫检查点分子水平,发现大部分分子都是在cluster1中高表达(图2C)。同时在TCGA队列中发现cluster1的病理分级要高,IDH突变比例也明显高于cluster2,由此说明cluster1恶性程度更高。
图2.两个集群的特征3.巨噬细胞分组集群的基因组特征
图3A和3B中展示了两个集群的全基因组CNV图谱,根据体细胞突变分析发现,EGFR (29%), TP53 (27%), PTEN (23%) 以及TTN (23%)的突变更多的富集在cluster1中;相比之下,cluster2中IDH1 (93%), TP53 (52%), ARTX (38%) and CIC (25%)的突变更多(图3C)。
图3.两个集群的基因组特征4.富含巨噬细胞的胶质瘤中的 DMP 与肿瘤进展相关
通过设置cutoff(Δbeta value >0.4 和p value <0.05),共鉴定出8359个DMP,其中8301个上调,58个下调。图4A热图中展示了鉴定出的DMP在两组中情况。Cluster1的基因组表现出整体低甲基化趋势,84.2% 的 DMP 处于低甲基化状态(图4B),在基因组的分布中,DMP主要集中在IGRs和TSS区域。图4C中是DMP在染色体上的分布情况。对DMP相关的基因进行GSEA分析发现,高甲基化基因对肿瘤相关的生物过程有更关键的作用,如 TGFβ、肿瘤坏死因子 α (TNFα) 和白细胞增生(IL-2)等(图4D)。GO 富集(图4E)分析还发现T 细胞活化、增殖和分化活动增加。同时还计算并比较了两个集群中主要免疫细胞类型的富集分数,Cluster1中的单核细胞和中性粒细胞水平高于Cluster2,而Cluster2中的B细胞、NK细胞和CD4+ T细胞水平更高(图4F)。
图4.两个集群的甲基化特征5.MScore的构建及其功能注释
弹性回归和PCA分析用于构建风险评分,也就是MScore。评估了64种细胞类型的表达水平与 MScores 的相关性,与成纤维细胞、巨噬细胞和单核细胞水平呈正相关(图5A)。生存分析发现high-MScores和low-MScores的生存具有显著差异(图5C)。与巨噬细胞的激活和迁移、树突状细胞分化和 T 细胞增殖负调控相关的通路在high-MScores分组的样本中富集更多。同时,研究人员还在另外15个胶质瘤数据集中验证发现MScores可以很好的区分患者的不同生存情况(图6)。此外,还探究了其在其他癌症中的作用,发现在嗜铬细胞瘤和副神经节瘤、肾嫌色细胞和葡萄膜黑色素瘤等是不利因素,对弥漫性大B 细胞淋巴瘤、前列腺腺癌和甲状腺癌有促进作用(图 5D),这也说明了肿瘤微环境的异质性。MScores的GO富集功能分析还表明,MScores 与巨噬细胞活化、成纤维细胞增殖、肥大细胞活化调节和调节性 T 细胞分化呈正相关,表明存在免疫抑制微环境(图5E)。生存分析发现high-MScores组的患者生存情况更差(图5F)。图5G中的IHC染色结果表明high-MScores的样品的CD163表达更高。
图5. MScore特征 图6.基于MScores分组的生存分析6.基于MScores的预后模型的构建
在TCGA和CGGA胶质瘤队列中MScores被确定为危险因素,然后结合患者年龄、肿瘤等级、IDH突变和染色体1p/19q编码缺失等因素构建预后模型,并在CGGA队列中的693个样本中得到验证。
7.基于巨噬细胞分组的患者对免疫疗法的反应的预测
研究人员首先评估了MScores是否能预测免疫阻断治疗对胶质瘤患者的治疗效果,发现并不能很好的区分不同的生存情况(图7A)。然而,当根据免疫治疗反应类型进一步对患者进行分组时,疾病进展组、疾病稳定组和部分反应组显示出不同的MScore,部分反应和完全反应组呈现出较低的 MScore(图7B)。与部分缓解组和完全缓解组相比,疾病进展组和疾病稳定组显示出更高的MScore百分比(图7C和7D)。同时还以二元模式对治疗反应样本进行分组,发现完全/部分反应组的高MScore百分比高于稳定/进展疾病组(图7E)。同时高MScore组的PD-L1水平也比较高(图7F)。最后MScore的预后价值也在GSE78220中进行了进一步的验证(图7G-I)。
图7. MScore对免疫的预测价值讨论
本研究首次通过WGCNA分析巨噬细胞密度作为胶质瘤预后标志的可靠性,利用提取的基因对患者进行分组,并通过多种方法机器学习方法进行验证。为了验证巨噬细胞的预后价值,评估了基于巨噬细胞密度分组的胶质瘤患者的肿瘤基因组学、TME、代谢和缺氧途径的综合情况(图7J)。总之,本研究分析确定了一个由 26 个巨噬细胞特异性基因组成的巨噬细胞基因特征,并确定了它们在胶质瘤中的预后价值。研究结果验证了巨噬细胞,尤其是 M2 巨噬细胞在胶质瘤进展中的调节作用。