8+非肿瘤结合泛癌纯生信,识别CD8T细胞相关的hub基因,思路
影响因子:8.786
关于非肿瘤生信,我们也解读过很多,主要有以下类型
1 单个疾病WGCNA+PPI分析筛选hub基因。
2 单个疾病结合免疫浸润,铁死亡,自噬等基因集,机器学习算法等。
3 两种相关疾病联合分析,包括非肿瘤结合非肿瘤,非肿瘤结合肿瘤或者非肿瘤结合泛癌分析
目前非肿瘤生信发文的门槛较低,有需要的朋友欢迎交流
研究概述:类风湿性关节炎(RA)是一种流行的慢性进行性自身免疫性疾病,然而,临床实践中仍然缺乏精确的治疗和管理方法。之前的研究表明,CD8+ T细胞在RA的进展中处于领先地位。本研究通过多个RA数据集、CIBERSORT和WGCNA算法识别RA中与CD8+T细胞密切相关的基因。进行了进一步的机器学习分析,以确定与RA最密切相关的CD8+T细胞相关基因。此外,本研究还探讨了这三个关键基因与33种癌症之间的关系,从而确定了10个基因与RA中的CD8+T细胞密切相关。机器学习分析确定了3个与RA最密切相关的CD8+T细胞相关基因:CD8A、GZMA和PRF1。
研究结果:
一、RA基因表达数据采集和免疫细胞浸润评估
从GEO数据库下载了类风湿性关节炎的微阵列表达数据,并选择了变异系数大于0.1的基因进行后续分析。确定数据集中每个样本中各种免疫细胞亚型的百分比。然后选择每个块的七个T细胞亚型的比例作为特征数据。
二、WGCNA共表达网络的建设
1.作者进行了WGCNA网络构建(图1A,B)。
2.作图,每个分支是一个模块,将所有表达水平相似的基因结合在一起(图1C,D)。然后将功能等效的模块组合成一个大型模块,共产生了37个模块(图1E、F、2A)。
三、中心模块识别与功能富集分析
1.作者发现,与CD8+ T细胞关系最密切的潜在重要基因具有更强的相关性。选择具有基因意义>0.75的基因作为候选中心基因,得到10个基因(NKG7、CD8A、DHRS9、CCL5、IL2RG、TNS3、PARP12、GZMA、PRF1、CYTH4)(图2B)。
2.BP中免疫应答激活细胞表面受体信号通路、抗原受体介导的信号通路和T细胞激活的基因在蓝色模块中高度富集。CC中质膜外侧、MHC蛋白复合物、分泌膜显著富集,而MF中细胞因子受体活性、MHC蛋白复合物结合、SH2结构域结合显著富集(图2C)。模块基因在Epstein-Barr病毒感染、趋化因子信号通路、抗原处理和KEGG呈现中显著富集(图2D)。
四、核心基因的筛选和识别
1.我们对上述10个基因进行LASSO和随机森林分析,通过LASSO分析共获得6个基因(NKG7、CD8A、TNS3、PARP12、GZMA、PRF1)(图3A)。从RF分析结果中选取重要基因进行分析(CD8A、DHRS9、CCL5、IL2RG、TNS3、GZMA、PRF1)(图3B)。
2.用维恩图对LASSO和RF的交集基因进行可视化,共发现4个基因(CD8A、TNS3、GZMA、PRF1)(图3C)。用GSE55235(图4A-C)、GSE55457(图4D-F)、GSE55584(图4G-I)、GSE1919和GSE48780(图4J-L)鉴定并验证CD8A、TNS3、GZMA、PRF1水平与CD8+ t细胞浸润之间的相关性,CD8A、GZMA和PRF1被鉴定为可靠的Hub基因,,三个基因与CD8+ t细胞浸润程度显著正相关。
3.同时,选择不同的癌症进行分析(图4),发现CD8A(图5)、GZMA、PRF1在各种恶性肿瘤中与CD8+T细胞浸润呈正相关。
五、核心基因相关性
1.验证不同数据集中hub基因之间的相关性,发现CD8A、GZMA、PRF1三者之间呈显著正相关。然后检测CD8A、GZMA和PRF1在各种恶性肿瘤中的关系(图6)。
2.除THYM、CD8A和GZMA在所有肿瘤中呈正相关外,CD8A和PRF1在33种肿瘤中呈正相关,GZMA和PRF1在33种肿瘤中呈正相关(图7A-C)。正常组织分析结果显示,CD8A与GZMA在各正常组织中呈正相关,GZMA与PRF1在各正常组织中呈正相关,CD8A与PRF1在骨髓中呈负相关,其余均呈正相关(图7D-F)。
六、转录因子分析
从CHEA3数据库中确定了与CD8A、GZMA和PRF1相关的8个常见转录因子(EOMES、TBX21、STAT4、ZNF80、GFI1、SCML4、ZNF831、RUNX3)(图8)。
七、基因富集
进行单基因GSEA分析,发现CD8A主要富集于类风湿关节炎、哮喘、胆固醇代谢等(图9A)。GZEA主要富集在胆固醇代谢、类固醇生物合成、矿物质吸收等方面(图9B)。PRF1主要富集在冠状病毒病COVID-19、磷酸戊糖途径和亚油酸代谢中(图9C)。
八、中心基因相互作用分析
1.作者构建了一个20个基因的交互网络(图10A)。
2.在BP中,基因主要富集于T细胞介导的免疫、形态修饰或其他生物的生理。CC中基因主要富集在免疫突触和质膜外侧,MF中基因主要富集在磷脂酶激活剂活性和脂肪酶激活剂活性(图10B)。KEGG通路中的基因可能调控原发性免疫缺陷、病毒蛋白与细胞因子的相互作用以及细胞因子受体这些中心基因可能对免疫系统至关重要(图10C)。
研究总结:
在本研究中,根据CIBERSORT算法和加权基因相关网络分析(WGCNA)分析的结果,作者最终确定了10个关键的CD8+ T细胞相关基因与RA中CD8+ T细胞浸润最密切的三个基因,即CD8A、GZMA和PRF1,探讨了这三个关键基因与33种癌症物种之间的关系,发现它们与多种癌症有关。这一发现指出了治疗RA的新途径。