研究思路 | 单细胞多组学如何研究?不要看别的了,一文让你懂的透
细胞图谱构建、细胞亚群分析、稀有细胞类型鉴定、肿瘤微环境、疾病发生机制、耐药性、发育分化、免疫研究……,回顾近年来的科学研究,单细胞转录组已成为科研界当之无愧的热点话题,其以单细胞级别的高分辨率和广泛的适用性成为科研界的“宠儿”。单细胞ATAC+基因表达多组学能够将基因表达与调控元件的可及性联系起来,在解决细胞异质性的同时,可以挖掘其背后的转录调控机制,更准确地重建细胞生理学基础的分子过程,已成为CNS文章的“新宠”。
单细胞ATAC+基因表达是如何联合,一步步进行基因表达及其调控机制由浅入深的探究的呢?其实,如果一层一层剥开单细胞ATAC+基因表达多组学研究内容,会发现原来它包含这么多的“套路”!本篇从宏观的角度带领大家俯瞰已有的单细胞多组学研究文献,分两期介绍单细胞多组学的联合研究“套路”(基础版和Plus版)。本期先来看看多组学联合研究的基础版内容吧~
一、转录组和表观组联合分析鉴定细胞
单细胞研究的首要内容为细胞分群和定义细胞类型,单细胞转录组鉴定细胞类型的策略已相对成熟,而染色质状态可以影响细胞类型多样性和细胞命运特异性的发展模式。因此,通过单细胞ATAC+基因表达的两者联合有助于识别稀有细胞类型并完善细胞的注释信息。
1. 单细胞转录组和单细胞ATAC鉴定细胞类型基本一致,说明细胞类型鉴定的准确性
2021年Nature Genetics针对阿尔兹海默病(AD)的多组学研究中[1],研究者利用sn ATAC-seq和sn RNA-seq发现了大脑所有主要的细胞类型,包括兴奋性神经元(EX)、抑制性神经元(INH)、星形胶质细胞(ASC)、小胶质细胞(MG)、少突胶质细胞(ODC)和少突胶质祖细胞(OPC)。且两种数据独立分类的细胞类型在整合的UMAP空间中组合在一起。研究表明单组学和联合分析细胞类型的一致性和准确性。
图1 人前额叶皮层的多组学细胞鉴定(图片引自文献[1])2.单细胞转录组和单细胞ATAC鉴定细胞类型有所差别,进一步完善细胞注释
2019年Nature Biotechnology针对的同一细胞的转录组和染色质可及性的方法学研究中[2],研究者发现基于多组学数据的聚类在细胞类型之间产生更明显的边界,并可以识别在单一组学中很大程度上未被检测到的稀有群体(如周细胞和小胶质细胞)。在2020年Cell针对同一细胞中转录组和染色质可及性的方法学研究中[3],研究者还发现基于多组学数据的细胞类型聚类不仅可以区分不同谱系的细胞类型,还可以区分密切相关类型的细胞(例如,αhigh CD 34+与αlowCD 34+、毛囊永久部分和再生部分等)。研究表明联合分析有助于识别稀有细胞类型、更精细鉴定细胞类型并完善细胞注释信息。
图2 小鼠新生大脑皮层的多组学细胞鉴定(图片引自文献[1])3.结合对照组和实验组,解析细胞组成的变化
2021年Nature Genetics针对阿尔兹海默病的多组学研究中[1],sn ATAC-seq和sn RNA-seq细胞聚类中发现了多个神经元和神经胶质亚群。与对照样本相比,晚期AD中的细胞类型组成有明显改变(如ASC3显著增加,而ASC4显著降低)。远端和近端差异染色质可及区域以及差异表达基因的GO富集显示高度的细胞类型特异性。这些可能是神经退行性变中不同细胞亚群中不同生物途径失调的基础。
图3 阿尔茨海默病细胞异质性的多组学特征(图片引自文献[1])二、基因表达与染色质可及性分析结果的相互印证
单细胞转录组测序能够解释细胞的转录状态和表达情况,单细胞染色质可及性测序能够揭示基因表达相关的染色质开放状态和调控景观,二者同时应用能够将基因表达与调控元件的可及性联系起来,有助于差异基因表达背后调控机制的挖掘。
1.单细胞基因表达与染色质可及性相关性
2020年Cell针对同一细胞中转录组和染色质可及性的方法学研究中[3],通过多组学得到了单细胞每个基因的表达量和单细胞染色质可及性的峰,将特定基因的表达量与染色质可及性的峰关联起来,识别了63,110个显著的Peak-Gene关联。类似的,2021年Cell针对人大脑皮层的多组学研究中[4],基于相关性分析将基因远端顺式调控元件(CRE)可及性与基因表达联系起来,确定了64,878个代表潜在增强子-基因相互作用的CRE-Gene对。且同种细胞类型的染色质可及性和基因表达表现出高相关性。
图4 基因表达与染色质可及性相关性(图片引自文献[3,4])2.染色质可及性验证基因表达情况
2021年Cancer Cell针对三阴性乳腺癌(TNBC)的研究中[5],研究者通过sc RNA-seq研究,发现了CD8-CXCL13 和 CD4-CXCL13 在 TNBC 肿瘤中扩张,对联合治疗有反应。匹配治疗前后的配对sc ATAC-seq 数据,进一步检查了 CD8+、CD8-CXCL13 和 CD4-CXCL13 的染色质可及性的动态变化,染色质可及性动力学揭示的发现与基于转录组的分析结果一致,如两者都支持联合治疗后 CD8-CXCL13 增强的效应特性。
图5 三阴性乳腺癌联合治疗后反应性肿瘤中T细胞亚群的转录和表观遗传动态(图片引自文献[5])3.染色质可及性预测基因表达情况
2021年Cell针对人大脑皮层的多组学研究中[4],除了将基因远端顺式调控元件可及性与基因表达联系起来,确定了64,878个CRE-Gene对外,研究者还通过对基因活性-表达相关性的排序,确定了一组可以根据局部单一染色质可及性很好地预测其表达的基因(185个GPC),这些染色质的可及性对基因表达有强烈的预测作用,且该基因集在转录调节活性和DNA结合TF活性方面高度富集,局部可及性先于循环祖细胞中的谱系特异性基因表达。
图6 根据染色质可及性预测其表达的基因(GPC)(图片引自文献[4])三、探究染色质可及性对基因表达的调控机制
单细胞转录组够发现关键细胞类型的关键基因,有可能作为潜在诊断和治疗靶点。但其背后差异表达的机制尚不清晰。而多组学研究可解析基因调控元件(如启动子、增强子)的染色质可及性状态,有助于探究其转录因子的结合活性,进而探究细胞类型特异性表达差异背后的调控机制。
1.发现细胞类型特异性顺式基因调控元件
2021年Nature针对人脑皮层发育的多组学研究中[6],研究者共发现265,123个染色质开放区,确定了每种细胞类型特异性的差异可及性开放区,结果发现大多数细胞类型具有数千个特异的开放区。研究还联合其他技术鉴定了候选增强子和启动子元件,共鉴定了25,659个基因连锁增强子,发现了67,493个峰和10,050个预测的增强子(具有启动子相互作用的物理证据)。这些发现确定了scATAC-seq在不同细胞类型中识别出与已知转录因子表达模式一致的染色质可及性模式,为发现细胞图谱和细胞命运的转录因子编码提供了路径。
图7 鉴定细胞类型特异性顺式调控元件(图片引自文献[6])2.鉴定细胞类型特异性转录因子
2021年Nature Genetics针对阿尔兹海默病的多组学研究中[1],研究者为补充对顺式调节元件的分析,在晚期AD中识别了特定细胞类型的反式调节元件。转录因子(TF)在神经发育过程中严格控制细胞命运,并与神经退化过程有关。通过构建特定细胞类型的TF调控网络,发现了在晚期AD中起作用的转录因子,如SPI1在晚期AD中充当转录阻遏物,而由NRF1失调介导的线粒体功能受损可能通过髓鞘形成的破坏导致晚期AD的神经元功能障碍。
图8 人前额叶皮层的多组学细胞鉴定(图片引自文献[1])3.揭示细胞类型特异性转录调节机制
通过单细胞多组学的联合分析,进行细胞类型特异性顺式调控元件和细胞类型特异性转录因子的鉴定,可以结合其功能研究进一步探究细胞类型特异性转录调节机制。2021年Nature Genetics针对阿尔兹海默病的多组学研究中[1],研究者鉴定了11,440个候选顺式调节元件(cCRE)和56,552个Gene-cCRE关联对(gl-cCRE),这些gl-cCREs在每个snATAC-seq类群中的染色质可及性具有高度的细胞类型和簇特异性。通过非负矩阵分解(NMF)等处理步骤,划分为多个生物功能模块。结果发现,部分功能模块在AD中的异常变化的确广泛存在于多种细胞,但在每种细胞类型下,还相应存在可以特异性区分AD和对照组的基因调控模块。
图9 细胞类型特异性顺式调控机制研究(图片引自文献[1])四、总结
单细胞转录组能够大规模平行分析单个细胞的数千个分子特征,发现关键细胞类型的关键基因,揭示不同细胞类型之间的差异,但其背后差异表达的机制尚不清晰。单细胞多组学可真实反映同一个细胞内基因表达与表观调控内在联系,确定候选的调控元件及其靶基因的直接联系,从而定义独特细胞类型的调控元件和细胞状态,解释基因表达差异的原因,揭示与肿瘤、疾病相关基因调控网络及其背后调控机制。以上研究内容为转录组和表观组平行研究的基础,逐渐成为单细胞多组学文章的必备内容,总结研究思路如下:
图10 单细胞多组学一般研究思路总结(基础版)参考文献
1. Morabito S, Miyoshi E, Michael N, et al. Single-nucleus chromatin accessibility and transcriptomic characterization of Alzheimer's disease[J]. Nature Genetics, 2021, 53(8):1143-1155.
2. Chen S, Lake BB, Zhang K. High-throughput sequencing of the transcriptome and chromatin accessibility in the same cell[J].Nature Biotechnology, 2019, 37(12):1452-1457.
3. Ma S, Zhang B, LaFave LM, et al. Chromatin Potential Identified by Shared Single-Cell Profiling of RNA and Chromatin[J].Cell, 2020, 183(4):1103-1116.
4. Trevino AE, Müller F, Andersen J, et al. Chromatin and gene-regulatory dynamics of the developing human cerebral cortex at single-cell resolution[J]. Cell, 2021, 184(19):5053-5069.e23.
5. Zhang Y, Chen H, Mo H, et al. Single-cell analyses reveal key immune cell subsets associated with response to PD-L1 blockade in triple-negative breast cancer[J].Cancer Cell, 2021, S1535-6108(21)00499-2.
6. Ziffra RS, Kim CN, Ross JM, et al. Single-cell epigenomics reveals mechanisms of human cortical development[J]. Nature, 2021, 598(7879):205-213.