易基因|综述:单细胞DNA甲基化分析方法全介绍及未来发展前景预测
大家好,这是专注表观组学十余年,领跑多组学科研服务的易基因。
2021年07月10日,《Biomolecules》杂志上发表一篇关于单细胞表观测序的综述文章,详细介绍了单细胞DNA甲基化的实验策略、分析方法、数据分析以及相关科研应用并讨论了单细胞甲基化测序的未来发展前景。以下为原文总结分享:
Introduction
在这篇综述中,作者概述了测序单细胞DNA甲基化图谱的方法,介绍了单细胞分析方法的基本原理和技术,并讨论了不同方法之间的差异。此外,因为大多数单细胞甲基化分析需要来自基因组内许多位置的数据来进行比较,因此在本综述中只介绍了全基因组的方法。另外,作者还介绍了DNA甲基化主要用于单细胞的应用方法以及发展前景。
一、实验方法
表1.单细胞DNA甲基化检测方法概述
1.重亚硫酸盐转化法
目前,有几种分析甲基化的方法,根据是否发生碱基转换,这些方法可以大致分为两组。在碱基转化的情况下,胞嘧啶或甲基胞嘧啶被试剂选择性地修饰,最后通过测序检测为胸腺嘧啶。基于碱基转换的方法的优点是允许检查单个CpG位点的甲基化,无论是否转换。这类方法包括重亚硫酸盐测序法、TAPS(TET-assisted pyridine borane sequencing)和酶法甲基化测序法(EM-seq)。TAPS和EM-seq是近期开发的,因此传统的单细胞甲基化分析是基于重亚硫酸盐的转化。使用重亚硫酸盐转化的方法被认为是分析DNA甲基化的金标准。由于其转化效率高(>99%)、重复性好、易于通过商业试剂盒获得,因此受到研究人员的青睐。
但重亚硫酸盐转化法使用的反应条件苛刻,会导致DNA降解。降解会导致DNA丢失和序列质量降低,从而导致最终数据产量的损失。因此,研究人员开发了PBAT(Post-bisulfite adaptor tagging),以解决降解造成的损失问题(图1a)。
图1此外,RRBS和WGBS是最常用的全基因组甲基化分析方法。这两种方法都包括重亚硫酸盐的转化和NGS文库的制备。这两种方法之间的主要区别是RRBS需要使用合适的限制酶来筛选GC丰富的区域(图2a)。
传统的RRBS可分为五个步骤。第一步是用限制性内切酶消化DNA,第二步是接头连接及其前处理,第三步是选择富含GC位点,第四步是重亚硫酸盐转化,最后是测序前的扩增过程。这些过程包括几个纯化步骤,最后一个扩增步骤,是为了补偿之前过程中的损失。与传统的RRBS不同,单细胞RRBS由于从单个细胞输入的DNA量很少,常规方法不能保证目标DNA在最后的扩增过程中保持不变。因此,单细胞RRBS在降损方面进行了细化。scRRBS是一种专注于将纯化过程中发生的损失降至最低的方法。损失的减少是通过限制性内切酶消化、接头连接过程和在单管中转化重亚硫酸盐实现的,不需要纯化(图1b)。
图2另外,WGBS(特别是MethylC-seq)的优势在于能够覆盖基因组中的大部分CpGs。与RRBS相比,WGBS的纯化和筛选过程相对简单。在WGBS中防止重亚硫酸盐转化过程中的降解损失被认为是相对重要的,因此许多基于WGBS的单细胞方法往往是基于PBAT的。
2.无需BS转换的方法
无需BS转化进行甲基化测序的方法主要分为两类:利用甲基胞嘧啶的亲和结合和利用限制性内切酶对甲基胞嘧啶的敏感性。MBD-seq和MeDIP-seq是具有基于亲和性的具有代表性的方法。基于亲和力的方法不适合在单细胞测序上应用,因为这些方法是基于DNA片段产生平均DNA甲基化谱,因此无法区分单个细胞中DNA甲基化模式的差异。然而,与基于亲和力的方法不同,基于MSRE的方法经过改进后可以用于单细胞测序, scCGI-seq测量甲基化的方式与Methyl-seq类似。
由此可见,重亚硫酸盐转换法是目前的金标准。因此,接下来关于分析方法的介绍使用重亚硫酸盐转化法作为示例。
二、数据分析
图31.数据质量评估
在进行了包括RRBS和WGBS在内的测序实验后,需要对序列数据进行预处理。前处理步骤可分为数据质量控制(QC)、测序读数的修剪和测序读数的比对。质量控制的第一部分利用FastQC等软件程序测量总体基本测序数据质量。在进行全面的序列质量评估后,应确定重亚硫酸盐测序的转换效率。对于重亚硫酸盐转化率低的样品,区分CpG位点上以胞嘧啶形式测序的碱基和真正的甲基化胞嘧啶或测序错误是具有挑战性的。这在下游分析中起到了混杂因素的作用,包括寻找差异甲基化区域。通过计算胞嘧啶位置的转换碱基的比例或使用可用的软件程序,可以直接从添加的未甲基化的lambda DNA中获得转换效率。
2.Read剪切和序列比对
使用软件进行序列剪切,然后将修剪后的序列读数与参考基因组进行比对。
表2. 重亚硫酸盐测序reads比对软件
3.利用甲基化水平进行甲基化分析
甲基化分析的主要目的是探索构成样本、器官和疾病状态(包括癌症)之间差异的表观遗传学证据。为了发现这些差异,需要一个表征此概念的数值,常用的是β值,计算公式如下。在甲基化调用后,进行后续分析,如可视化分析的t-SNE,聚类分析,以及识别差异甲基化胞嘧啶(DMCs)或差异甲基化区域(DMRs)。
4.利用Reads甲基化模式进行甲基化分析
最近的甲基化分析利用了每个reads的甲基化模式来诊断疾病,尤其是癌症。这种新的分析概念是基于甲基化的生物学特性,即除非出现从头甲基化,否则相邻CpG位点之间有保持甲基化的趋势。该reads模式分析方法能够检测具有疾病信号的DNA分子,并且具有增加疾病信号检测机会的可能性。例如,一项大型液体活组织检测研究设计了一个集成分类器,根据reads模式分析对肿瘤类型进行分类,并在早期癌症的检测中显示出显著的结果。此外,通过甲基化模式对肿瘤衍生的DNA分子进行量化是观察肿瘤负担的另一种方法。
图4三、场景应用
1.细胞发育
生殖细胞或胚胎细胞的成熟受到特定基因表达的影响,这与DNA中的甲基化水平相关。例如基于植入前的胚胎细胞的甲基化特征,利用单细胞甲基化测序,通过对早期胚胎系追踪的研究,研究植入前细胞甲基化的机制及其现象。研究团队观察到非CpG甲基化在卵母细胞成熟过程中不断积累,说明非CpG甲基化与CpG甲基化在卵母细胞成熟过程中的作用不同。
2.与疾病相关的研究
在疾病患者中,DNA甲基化的模式与健康人不同。在各种疾病中,癌症尤其具有正常细胞所不具有的DNA甲基化模式,从而导致基因表达水平的差异。在对具有这种异质性的癌症研究中,需要使用多组学方法,将基因组变异和RNA表达结合起来进行分析。例如一个研究小组最近开发了一种称为scTrio-seq2的方法,它整合了单细胞转录组和单细胞甲基化测序数据。多项研究表明使用单细胞甲基化测序(sc-methyl-seq)的多组学方法可以克服先前方法的局限性,并且具有更好的鉴别能力。因此,sc-methyl-seq可用于各个领域,以解决与生物过程和疾病相关的基本问题。
四、未来发展前景
未来DNA甲基化将具有很大的发展前景。由于NGS的发展,数据采集的成本正在逐渐降低。此前测序成本是全基因组重亚硫酸盐测序研究的瓶颈,因此随着测序成本的降低,将产生更多的全甲基化数据。科学家们努力在不同细胞类型之间建立标记集,包括小鼠大脑的DNA甲基化和某些组织类型的DMR发现。此外,国际人类表观基因组学联盟(International human epigenome consortium for Research the human
epigenome,IHEC)花费大量资源来了解与疾病相关的甲基化模式和不同细胞类型之间的异质性。综合数据的积累可以为研究甲基化提供更多可能。甲基化证据的积累将有可能发现由不同组织类型、不同实验或环境条件以及癌症等异质性疾病而变化的甲基化热点区域。
此外,通过DNA甲基化数据积累发现细胞类型特异性标记将有助于通过单细胞DNA甲基化数据的可视化进行细胞异质性分析,包括在t-SNE图中分配细胞簇。相信对甲基化及其在疾病中的生物学作用之间关系的理解将在未来的进一步数据中得到揭示。
技术指标: