SingCellaR:一站式解决单细胞数据功能分析
前言
Immugent在之前的一篇推文:ProjecTILs:一站式解决肿瘤和感染模型中T细胞的注释中,介绍了如何使用ProjecTILs对感染和肿瘤模型中T细胞的注释,后续又写了一系列代码实操的推文对其进行了系统介绍。在单细胞数据分析中,除了T细胞的注释比较繁琐之外,对其上游来源--造血干细胞分化各阶段的注释也是十分复杂的。因此,今天Immugent就来系统介绍一个用于造血干细胞功能注释的软件--SingCellaR。
这个软件对应的文章于2021年发表在Cell reports杂志上,篇名为:Transitions in lineage specification and gene regulatory networks in hematopoietic stem/progenitor cells over human development。同时,还有一篇专门介绍这个软件使用方法的文章,于今年发表在STAR Protocols杂志上,篇名为:Processing single-cell RNA-seq datasets using SingCellaR。由于前一篇研究着手解决的是各年龄段造血干细胞的发育和功能调节,因此作为本篇推文主要解读的对象。后续生信宝库还会基于后一篇研究发一系列推文,通过代码实操的形式讲解如何使用SingCellaR对我们自己的数据进行分析。
当然,SingCellaR本身是类似于Seurat一样,是能进行一站式单细胞数据分析的强大工具,我们可以从下面介绍的Figs中可以看到SingCellaR出图的配色也是别具一格,很漂亮的,而且还整合了多种分析流程;此外,其内置的造血干细胞相关的signatures比较方便大家对干细胞分化进行分析,当换成其它gene sets也是可以的,只是在本节推文我们主要介绍造血干细胞分化的研究。
主要研究内容
单细胞测序技术已被广泛应用于解析正常和紊乱的造血细胞,以及界定人类产前血液和免疫细胞功能状态。这些研究和其他观察都强调了人类胎肝中红系细胞和胚胎骨髓中B淋巴细胞的优势。胎儿和出生后HSPC增殖能力的差异已通过功能研究进行描述。从多能干细胞到寡能/单能干细胞的转变也有文献记载在胎儿和成人之间。然而,从人类个体发育的早期到成年的多个时间点在单细胞分辨率下采集的Hspc以前没有报道过。
image.png因此,本项研究作者构建了一个全面的数据集,包括57,489个从健康人类造血组织中采样的hspc,包括早期妊娠期FL (eFL)、成对的中期妊娠FBM和FL(分离自同一胎儿)、儿童BM (PBM)和成人BM (ABM)。这项研究在单细胞水平上直接比较了个体发育的所有阶段(早期胎儿到成年)的人类HSPC。在整个人类发育过程中,通过对HSPC细胞组成和分子途径的一致性和差异性的精确描述,结果表明造血组织之间的细胞结构和转录谱中存在显著的位点和发育阶段特异性转变。
image.png为了探索细胞群之间的发育关系,作者使用force-directed graph (FDG) network对细胞的基因表达进行排序。谱系标记基因评分与之前一样定义,并叠加在FDG上。结果发现了HSC/MPP集群中出现的4条主要路径,代表红系、巨核细胞、淋巴系和髓系沿假时间分化的轨迹。通过使用细胞数量的百分比以及DA-seq等算法,研究者进一步分析了不同的各个发育阶段中不同细胞谱系的丰度。结果发现巨核细胞和红细胞在早期胎儿肝脏(eFL)中比例较高,但是在发育过程中,特别是骨髓开始造血后,淋巴和髓系的祖细胞出现了显著的扩增,骨髓中的淋巴组细胞比例的出生后逐渐降低。
image.png利用该单细胞图谱数据集,研究者综合力导向图(force directed graph)算法和扩散映射(diffusion map)算法进一步分析了造血干细胞起始—发育轨迹(developmental trajectory),包括红系、巨核细胞、淋巴细胞系和髓系细胞系,并结合Monocle3的拟时序分析,对各个发育路径中的关键基因的表达进行分析发现,在不同的发育阶段,不同的谱系呈现不同的表达谱。研究人员还通过pySCENIC对各个发育轨迹的主要转录因子进行了分析。
image.png总之,这项研究为今后Lin-CD34+HSPC的发育研究提供了非常好的资源,可以作为参考数据集来研究年龄特异性的血液疾病。例如,研究人员将这一数据集和此前发表的两类血液疾病,多发于儿童的幼年型粒单核细胞白血病 (JMML)和多发于老年人的骨髓纤维化(MF)的数据集进行了整合分析,进一步比较了JMML和MF这两种血液疾病和正常造血系统的时空发育的转录组异同。
展望
干细胞的研究一直都是科研界的热点方向,特别是揭示生理状况下的人类个体发育过程中造血干细胞的功能变化,将为我们进行各种基于干细胞的临床治疗提供理论支持。此外,深入了解不同造血组织之间的相似之处和差异性,将为研究最原始的Hspc特征,及在人类一生中其谱系命运如何变化提供了重要的资源。这项研究的结果为更好地理解正常人发育中的造血功能铺平了道路,同时指出从不同年龄的供者中选择用于细胞基础治疗(包括基因编辑和干细胞移植)的Hspc的组成特征。此外,这项研究还帮助我们认识了特定血液疾病的起源,以及深入了解年龄特异的干细胞脆弱性的分子特征。
需要注意的是,由于目前单细胞测序深度不足的原因,导致我们往往无法精准的凭借一两个经典的marker基因进行细胞注释,因此基于gene sets或者功能通路的方式为我们提供了另一条思路。此外,由于单细胞数据中存在很多0值,使得其数据分布不符合任何经典的统计分布,因此使用特别为单细胞数据量身定做的算法是相对准确的,如本文使用的AUCell,还有"UCell", "singscore"等。
好啦,本期关于SingCellaR的介绍到这就结束啦,我们下期会推出这个软件的代码实操教程,敬请期待!
[参考文献]
Roy A, Wang G, Iskander D, O'Byrne S, Elliott N, O'Sullivan J, Buck G, Heuston EF, Wen WX, Meira AR, Hua P, Karadimitris A, Mead AJ, Bodine DM, Roberts I, Psaila B, Thongjuea S. Transitions in lineage specification and gene regulatory networks in hematopoietic stem/progenitor cells over human development. Cell Rep. 2021 Sep 14;36(11):109698. doi: 10.1016/j.celrep.2021.109698. PMID: 34525349; PMCID: PMC8456780.