文章套路GEO数据挖掘

小众非肿瘤疾病如何上4.9分?

2020-11-04  本文已影响0人  生信风暴

今天跟大家分享的是2020年2月发表在J Inflamm Res杂志(IF=4.953)上的一篇文章:”Integrated Gene Expression Profiling Analysis Reveals Probable Molecular Mechanism and Candidate Biomarker in Anti-TNFα Non-Response IBD Patients”。在文章中作者通过整合分析多个数据集进行有无应答IBD患者之间的差异基因并进行功能注释,通过PPI网络找出关键基因后进行多个数据集的验证,并联合免疫浸润分析揭示有无应答IBD患者之间免疫机制的差异,为TNFα治疗相关耐药性的研究提供新的思路。

Integrated Gene Expression Profiling Analysis Reveals Probable Molecular Mechanism and Candidate Biomarker in Anti-TNFα Non-Response IBD Patients

整合基因表达谱揭示抗TNF-α无应答IBD患者可能的分子机制和候选生物标志物

一.研究背景

溃疡性结肠炎是一种常见的肠道炎症性疾病。由于疾病的严重性降低了人们的生活质量,在北美和欧洲有100万人受到影响。抗肿瘤坏死因子α(anti-TNFα)已成为治疗该病的主要策略之一,但缺乏预测抗肿瘤坏死因子α药物疗效的准确性,患者必须接受较长时间的治疗以确定所选药物是否有效。因此,探讨候选生物标记物对早期干预IBD患者治疗具有重要意义。

二.结果解读

1.差异基因的筛选

通过GEO数据库共检索数据集6个肠道组织的数据集作为发现集,2个血液样本的数据作为验证集用于后续研究。PCA结果显示,矫正后各样本的批次效应消除。所有来自验证队列的五个队列通过整合使用NetworkAnalyst方法求出差异基因(P-value <0.05 &|log2FC|>0.85),共确定274个上调基因以及14个下调基因。

图1:五个微阵列数据集的样本聚类和差异表达基因的热图

2.差异基因的功能注解

利用DAVID以及cytoscape的ClueGO插件对差异基因进行功能富集分析,其中Toll样受体信号通路富集分析较高,与其相关的炎症机制与IBD的发病密切相关。

图2:差异表达基因的火山图以及通路分析网络

3.差异基因富集结果的验证

IL6在有应答组和无应答组之间有显著差异(与差异分析结果相符),而TNF和NOD2并未发现明显差异。此外,通过GSEA分析比较有应答组和无应答组之间的通路差异,结果标明,Fc-gamma受体信号转导和Toll样信号传导通路在有应答组中均表达上调,与差异分析富集结果吻合。

图3:有应答组和无应答组之间biomarkers的表达及GSEA分析结果

4. 有应答组和无应答组之间免疫细胞含量差异

通过Cibersort算法分析肠组织有应答组和无应答组的免疫细胞组成,22个免疫细胞的分数如小提琴图所示。与有应答组患者相比,无应答组患者肠道组织中的M2巨噬细胞分数相对较低。在无应答组个体中,M1巨噬细胞在M1和M2巨噬细胞中的比例也很高。

图4:有应答组和无应答组之间免疫细胞含量差异

5. PPI网络分析及关键基因的筛选

研究通过Cytoscape构建了包含140个节点和975个连接的PPI网络。使用Cytoscape的MCODE插件提取PPI网络中连接最紧密的簇,其中连接度最高的基因包括TLR1、TLR2、TLR4、TLR8、FCGR2A、HCK、CD36、CCR1、CCL4,与炎症和趋化作用调节密切相关。

图5:PPI网络构建及关键基因的筛选

6.通过lasso以及ROC验证候选生物标记物

随后,通过lasso回归以及ROC曲线验证上一步分析筛选出来的关键基因,结果表明,在这些关键基因中,FCGR2、TLR1、TLR2和HCK是肠道中最明显的基因,至少有一项研究的AUC都超过了0.9,而在血液样本中FCGR2A、HCK和TLR8均表现良好。

图6:LASSO回归模型及ROC曲线的构建

小结

本研究旨在探讨IBD患者基因表达谱中与抗TNF-a药物反应相关的分子机制和候选生物标志物。通过生物信息学方法筛选出286个DEGs和9个hub基因,并发现FcγR信号和TLR轴的相互作用可能是IBD患者对抗TNFα药物敏感性不同的原因。全文思路清晰,通过联合多个数据集以及免疫浸润机制,全面解析IBD有无应答者之间的机制差异,后续对于其他疾病的研究也有了更多的借鉴之处,如结果最后筛选的hub基因可通过加入湿实验进行验证,使分析方法更为灵活; 此外,也可通过lasso回归后将筛选出来的变量用于模型构建,并在其余数据集进行外部验证也是一个很好的选择。

上一篇 下一篇

猜你喜欢

热点阅读