Cell:东亚最大的eQTL数据库:ImmuNexUT

2021-06-15  本文已影响0人  概普生信

2021年5月发表在Cell (IF=38.639)上的Dynamic landscape of immune cell-specific gene regulation in immune-mediated diseases研究,利用免疫介导疾病 (IMD) 患者的样本构建了28种免疫细胞类型的基因调控图谱,显示了细胞类型和免疫条件对基因调控的动态影响。本文进行了大规模的免疫细胞基因表达分析,以及全基因组序列分析,包含来自 337 名被诊断患有 10 类免疫介导疾病的患者和 79 名健康志愿者的共计 28 个不同的免疫细胞亚群,捕获了不同免疫细胞类型和疾病的独特的基因表达谱。表达数量性状基因座 (eQTLs) 分析揭示了在免疫条件以及细胞类型背景下 eQTLs 效应的动态变化,这种细胞类型特异性的、和环境相关的 eQTLs 显示出与免疫疾病相关的遗传变异的显着富集,并且与疾病相关的细胞类型、基因和环境有关。此外,作者开发了网站ImmuNexUT (Immune Cell Gene Expression Atlas from the University of Tokyo) (https:// www.immunexut.org/) 便于用户访问数据。

数据:

基因表达数据以及eQTLs分析的统计数据存放于National Bioscience Database Center (NBDC) Human Database (https://humandbs.biosciencedbc.jp/en/),存储编号为E-GEAD-397、E-GEAD-398、E-GEAD-420。数据也可以在网站https:// www.immunexut.org/上浏览。

主要发现:

1.免疫细胞和免疫介导的疾病中基因表达多样性

作者从416个志愿者的9852个样本的基因表达数据中进行分析,包括79个健康的志愿者和337个免疫介导相关疾病的患者,纯化了28种不同的免疫细胞类型,包括几乎所有类型的外周免疫细胞。作者发现基因表达差异大都可以用细胞类型差异来解释,个体间的差异和临床诊断部分对基因表达变异的解释程度较轻。作者使用层次聚类分析表明,基因表达模式准确地再现了分离的免疫细胞亚型。每个细胞亚群都有特定表达的基因,包括细胞因子受体或模式识别受体,表明它们对环境信号有不同的反应。当比较基因模块失调的模式时,IMD被分为两组,主要对应于临床不同的自身免疫性疾病(SLE、MCTD、SSc、SjS、IIM和RA)和自身炎症性疾病(BD和AOSD)。此外,除了IMD中常见的异常调节途径外,一些基因在特定疾病中展现出独特的异常表达情况,暗示了未经识别的致病机制。

图1 免疫细胞与免疫介导疾病之间基因表达的多样性

2.QTLs表达具有免疫细胞类型特异性

作者利用深度全基因组测序数据(WGS)进行eQTLs分析,平均覆盖率达到41x。作者发现了13395个蛋白质编码基因和3839个长非编码rna的eQTLs,错误发现率为5%,平均每种细胞类型的常染色体基因eGenes中位数为7092个。在25%(中位数)的eGenes中确定了2个或更多的条件独立的变量,与最初的变异eVariants相比,这些基因的变异显示出更丰富的细胞类型的增强子区域。此外,作者观察到生物学上相关的细胞亚群之间eQTLs有明显的相似模式,这展现出了与细胞类型关联的特异性。

3.免疫介导的疾病特异的eQTLs表明体内刺激的影响

为了评估纳入患者来源样本对eQTLs鉴定的影响,作者接下来分别对健康志愿者样本或IMD患者样本的每个细胞亚群进行eQTLs分析。结果发现一些eQTLs仅在IMD患者中显著,并且在不同的细胞类型中IMD特异的eQTLs数目存在差异,但是整体趋势倾向于髓系细胞较多。与在健康志愿者和IMD患者中均显著存在的eQTLs相比,IMD特异性的eQTLs在增强子和刺激后诱导的免疫细胞ATAC-seq峰中显著富集。这些观察表明,使用不同患者来源的样本进行eQTLs鉴定有助于在生理条件下识别刺激依赖的eQTLs,这些eQTLs与疾病生物学相关,而仅在健康志愿者样本中难以检测到。

图2 eQTLs显示免疫细胞类型的特异性和体内刺激的影响

4. ImmuNexUT与之前的eQTLs研究具有良好的一致性

作者为了评估eQTLs的有效性,将结果与两个外部数据集进行了比较:日本105例健康患者的批量免疫细胞eQTLs研究,和目前最大的3万欧洲人的全血顺式eQTLs数据集。比较发现结果具有较好的一致性,但由于部分细胞类型的稀缺和相对独特的eQTLs特征,数据及之间存在一定的差异,互相提供了补充的信息。

图3 ImmuNexUT与之前的eQTLs研究具有良好的一致性

5. 结合来自不同种群的eQTLs数据集可以提高精细定位的准确性

为了评估日本eQTLs数据对eQTLs变异的精细定位的实用性,作者将自己的数据与来自GTEx v8的欧洲全血数据进行了精细定位,利用与全血的eQTLs有较大的重叠的经典的单核细胞和中性粒细胞数据进行了分析。与独立分析相比,联合分析显著减少了候选causal 变异的数量,同时保持了实验验证的功能变量的强富集,这表明结合来自不同种群的数据集进行精细制图是有效的。

图4 结合来自不同种群的eQTLs数据集可以提高精细定位的准确性

6.鉴定体内eQTLs效应多样化的生物学途径

作者分析了每种细胞类型的Top变异,通过随机扰动基因标签校正p值,识别到了5.6%的eGenes有37,875个显著的pGene-eQTL互作。与eQTLs存在显著正互作的pGenes在相互作用的基础上形成了不同的聚类,表明具有相似的基因调控机制相关的功能基因集。总体而言,与eQTLs互作较多的基因在IMD中显示出更多的变异。这些结果表明,将患者样本囊括在内的做法会通过提升pGenes的表达变异情况从而提升环境依赖的eQTLs的检测效能。免疫细胞环境依赖的eQTLs,特别是与疾病条件相关的eQTLs,可能在炎症反应或免疫反应的个体差异中发挥作用。

图5 鉴定体内eQTLs效应多样化的生物学途径

7. ImmuNexUT将IMD基因与细胞类型、基因和环境联系起来

作者利用eQTLs数据集来解释IMD相关的GWAS信号,使用分层LD回归评分来评估eQTLs与GWAS结果的相关性。当通过联合回归分析的eQTLs注释来制约共享元素时,尽管免疫疾病和免疫细胞eQTLs的特异性关联仍然存在,但大多数非免疫性状的关联会减弱。在某些情况下,GWAS顶部信号的eQTLs效应指向疾病易感基因。因此,作者通过邻近性评估了NHGRIEBI GWAS目录中顶级变异的富集情况,结果与非免疫性状GWAS在GTEx eQTLs中的富集形成对比。并且在系统性红斑狼疮患者中进行了免疫细胞亚群的特异性分析,这些亚群特异性和eQTLs可能对免疫细胞编排有很大影响,并可能与复杂的疾病发病机制相关。生信人 最热点生信话题

图6 ImmuNexUT将IMD基因与细胞类型、基因和环境联系起来 图7 通过共定位分析对系统性红斑狼疮风险基因进行排序

生信分析意向表

上一篇下一篇

猜你喜欢

热点阅读