什么是Repli-seq?
最近接触到一个新的测序method:Repli-seq!这篇笔记就是为了学习和思考浅层思考Repli-seq
文章题目:Sequencing newly replicated DNA reveals widespread plasticity in human replication timing
1:什么是Repli-seq?能解决什么问题呢?
真核细胞的细胞周期中,母细胞复制它们的染色体,并将复制的基因组分离到它们的子细胞。在DNA进行复制的过程中,遗传信息的传递是非常重要的(在表观上也非常重要)。
伴随着DNA的复制,会有父链和子链的生成。但是尚不知道人类复制程序在不同细胞类型之间变化的程度,以及这种变异与人染色质的结构和可及性之间的关系。
从Taylor等人使用氚化胸苷可视化脱氧核糖核酸复制【1】的实验开始,动物细胞中的复制被组织成具有相似复制时间的离散区域,由多个复制起点及其相关复制子组成,复制子的大小从30 kb到450 kb不等。【2】(理解一下, DNA的复制是半不连续半保留复制)
既然有非常多的复制子区域散布在基因组中,现在具有一个问题,是不是DNA在复制的过程中,会有很多的复制区域会发生同时复制?我们都知道在细胞分裂的过程中,DNA复制发生在细胞间期。细胞间期分为:G1,S,G2期;而DNA在复制发生在S期。
在DNA发生复制的时候,有很多Replication time zones ,它们在复制的时候是非常保守的。而复制条带在不同细胞类型之间似乎非常相似,这暗示了对不同人类细胞,不同发育谱系中复制程序的基本相似性。但是在复制的时候,还是有一部分存在复制时间的弹性。(不同的DNA复制的时期不一样,有复制早期和复制晚期)
除此之外,复制时间(replication timeing)是除了细胞复制功能的一个重要表观遗传组成部分。在细胞传代的过程中,很多表观信息也是被忠实的传递的。
为了全面定义人类细胞中的DNA复制程序,探讨其对基因组组织和高级转录调控的重要性。使用大规模平行测序(Repli-Seq)将DNA复制时间定量为基因组复制起始位置,并应用它来定义包括未分化胚胎干细胞(hESC)在内的多种人类细胞谱系的“复制体”。分析表明,至少50%的人类基因组表现出DNA复制时间呈现出组织特异性变异。
2:Repli-seq具体怎么实现的?
首先,它利用一种sequece-tagged sites (STS 序列标记位点)markers,对新生的链(子链)进行标记。用5-溴-2-脱氧尿苷(BrdU)在体内标记新合成的DNA链,它的原理是在新的复制DNA中替代胸腺嘧啶。然后,将标记的细胞分为六个部分,这些部分跨越细胞分裂的所有DNA合成阶段(G1b,S1,S2,S3,S4和G2)。然后用BrdU抗体去拉DNA下来,然后进行测序。
图一:Repli-seq approach
这个图表达的是,在正常淋巴母细胞样细胞系(LCL)中,新合成的DNA的细胞周期分级分离。 用BrdU标记指数生长的细胞,用DAPI染色,并根据DNA含量分选到细胞周期的不同部分,如该正常淋巴母细胞样细胞系(LCL)所示。 分选在整个细胞周期中是连续的。
图二:特定的基因的在复制过程中富集的情况
图二是淋巴特异性LRMP基因的早期的复制峰。 在50kb窗口上计算每个细胞周期分数的序列标签密度,根据其全基因组序列标签计数进行标准化,并通过计算总复制百分比在每个基因组位置进一步标准化。
3:使用基于PCR的复制时序验证Repli-Seq
为了确认Repli-Seq提供的复制模式与使用常规STS标记和基于PCR的分析获得的复制模式相同,采用了分析B淋巴细胞和K562细胞的β-globin locus进行分析。因为在B淋巴细胞中这个基因转录沉默,但是K562细胞系中,它转录活跃。
k562细胞和淋巴细胞的β-globin的复制情况
在细胞间期的G1,S1,S2时期,能看到β-globin在K562细胞中看到复制带。但是在淋巴细胞中,S3,S4,G2时期,我们能看到β-globin的复制带。说明转录时期是不同的。那么Repli-seq的数据是否和它是一致的呢?
repli-seq数据的结果
从repli-seq的数据来看,说明和PCR的数据是匹配的上的。
4:不同细胞谱系的Repli-Seq验证
在人的成纤维细胞(BJ),hESCs(BG02)和LCL(TL010)还通过将Repli-Seq重新应用于来自新的成纤维细胞来证实了其高重现性。根据观察到每种细胞类型的数据,发现了一些独特的谱系模式。
不同细胞谱系的验证
我们观察了每种细胞类型,以显示独特的全基因组复制时序曲线,发现有很多“恒定”结构域(在细胞谱系中峰都比较稳定),而有一些区域被称为“可塑”结构域,是细胞特异性的标志(图三B)。此外,在图四中, 还确定了几种区域复制时间的恒定型模式还有一些可塑性的模式图。我们发现,当对四种不同的细胞谱系进行比较时,人类基因组中有49%具有复制时间可塑性!
图四:“恒定”,“可塑”的结构repli-seq图
5:对peak进行注释
早期恒定复制(P <0.05)显著的区域与高基因密度,基因表达,Alu密度,GC含量,CpG密度,恒定早期区域也缺少L1-LINE和卫星序列(重复序列),而恒定晚期区域富含这些特征!
接下来进行replication time分类,把它分为“恒定”早期,晚期,可塑期。
发现了
图五 peak的分析
许多这些基因组特征在具有复制可塑性的区域中是可变的,基因含量与基因组的其余部分相比减少了30%,CG含量和Alu的含量比较少。该观察结果表明,晚期复制区域通常不仅定义了受抑制的区域,而且还定义了物理隔离的核区室。
图六 replication time分类
5:Replication Time和基因表达和染色体的结构
谱系特异性基因的表达和replication timing一致(就是转录活性比较高的区域,和早期replication timing相一致) 。接下来进一步的思考,染色质开放程度(高级结构)和基因的转录表达高度相关,染色质的结构和replication timing是否有关呢?为了寻找相关性,他们用DnaseI去切染色体,如果染色质比较松散的话是可以切的开的。如果染色质结构比较致密,则切不开。说明在转录,复制和染色质的高级结构上有一定的相关性。
图六 复制时间和基因表达的情况
6:双向复制时序
发现具有可塑复制的复制时序区域是一类双相复制域。 在雌性GM06990 LCL中沿着X染色体看到许多这样的区域。如何去理解这种双向的replication timing呢?
图七 五种细胞中X染色体的的峰图
作者解释到在女性中,X染色体有随机失活的情况。
图八 双向replication timing的情况
除了X染色体会发生这种情况以外,某些印迹域也可能会出现复制异步现象。 在hESC细胞中,15号染色体上的2 Mb Prader-Willi区域(G1和G2)发现的极端双相复制对具有细胞特异性(图九),除此之外,全基因组上还有一些其他的区域也存在类似的现象。
图九 hESC的 双向复制的情况
最后上一张workflow:
图片来自:https://www.illumina.com/science/sequencing-method-explorer/kits-and-arrays/repli-seq.html
Ref:
1:THE ORGANIZATION AND DUPLICATION OF CHROMOSOMES AS REVEALED BY AUTORADIOGRAPHIC STUDIES USING TRITIUM-LABELED THYMIDINEE. Taylor JH, Woods PS, Hughes WL Proc Natl Acad Sci U S A. 1957 Jan 15; 43(1):122-8.
2:Replication in context: dynamic regulation of DNA replication patterns in metazoans. Aladjem MI Nat Rev Genet. 2007 Aug; 8(8):588-600.