DNA甲基化及其基本功能
2019-01-24 本文已影响22人
Thinkando
1. 介绍
image.png- DNA甲基化途径。DNA甲基转移酶家族(Dnmts)催化甲基从S-腺嘌呤甲硫氨酸(SAM)转移至胞嘧啶残基的第五个碳,形成5-甲基胞嘧啶(5mC)。(a)Dnmt3a和Dnmt3b是从头 Dnmts并将甲基(红色)转移到裸DNA上。(b)Dnmt1是维持Dnmt并在复制期间维持DNA甲基化模式。当DNA经历半保守复制时,亲本DNA支架保留原始DNA甲基化模式(灰色)。Dnmt1与复制灶相关联,并通过在新形成的子链(蓝色)上添加甲基(红色)来精确复制原始DNA甲基化模式。
2. DNA甲基化的位置
- 基因区间
- 主要作用是是抑制潜在有害遗传元件的表达。(如插入的病毒原件)
- CpG群岛
- CpG岛是大约1000个碱基对的DNA片段,大多数基因启动子(大约70%)位于CpG岛内,CpG岛的甲基化可损害转录因子结合,募集抑制性甲基结合蛋白,并稳定沉默基因表达。
- 基因体
- 基因体的DNA甲基化如何促进基因调控仍不清楚
3. DNA甲基化的基本机制
- 甲基化的三类酶: writers, erasers, and readers.
- Writers are the enzymes that catalyze the addition of methyl groups onto cytosine residues. (建立)
- Erasers modify and remove the methyl group. (删除)
-
Readers recognize and bind to methyl groups to ultimately influence gene expression. (识别)
image.png
- 活性DNA去甲基化途径。5-甲基胞嘧啶(5mC)可在两个位点进行化学修饰:胺基和甲基。5mC的胺基可以通过AID / APOBEC脱氨(绿色),将5mC转化为胸腺嘧啶(Thy)。5mC的甲基可以通过添加由Tet酶介导的羟基来修饰,以产生5-羟甲基 - 胞嘧啶(5hmC)。5hmC也可以在两个位点进行化学修饰:胺基和羟甲基。AID / APOBEC可使5hmC脱氨(绿色)以产生5-羟甲基 - 尿嘧啶(5hmU)。在5hmC的另一个化学途径中,Tet可以进一步氧化(蓝色)5hmC以形成5-甲酰基 - 胞嘧啶(5fC),然后是5-羧基 - 胞嘧啶(5caC)。最终,每个途径的产品-Thy,5hmU,5fC,
4. DNA甲基化和其他表观遗传机制的串扰
- DNA甲基化与组蛋白修饰和microRNA(miRNA)一起调节转录。在真核生物中,DNA与组蛋白结合,有助于将长链DNA包装到小核区。将包括甲基化,乙酰化,遍在蛋白化和磷酸化的化学修饰添加到N-末端组蛋白尾部的三个特定氨基酸上。这些修饰不仅影响DNA链的包装方式,还影响其转录活性。松散DNA与组蛋白结合的组蛋白修饰通常为转录提供了允许的环境,而紧密包装DNA和组蛋白的组蛋白修饰抑制了基因表达。Dnmts直接与调节通常参与基因抑制的组蛋白修饰的酶相互作用(图3)。已知Dnmt1和Dnmt3a都与组蛋白甲基转移酶SUV39H1结合,后者通过H3K9上的甲基化来限制基因表达(Fuks 等,2003)。此外,Dnmt1和Dnmt3b都可以结合组蛋白脱乙酰酶,去除组蛋白的乙酰化,使DNA包装更紧密,限制转录的进入(Fuks 等,2000 ; Geiman 等,2004)。通常,Dnmts与组蛋白修饰酶配合,所述组蛋白修饰酶参与添加和/或剥离组蛋白标记,以便在基因区域上施加抑制状态。
image.png
4. DNA的甲基化和羟甲基化测序
-
DNA的甲基化是在DNA的序列不变的条件下,在其中某些碱基上加上甲基的这样一个过程。DNA甲基化的结果,一般是使甲基化位点的下游的基因表达量变少。
image.png - 化学反应:
- 这个(甲基化)分析方法当中的核心化学反应,是用亚硫酸氢盐来处理DNA。DNA当中,没有甲基化或羟甲基化的C碱基,就会被转化成U碱基。
- 我们来看这个转化的过程,在弱酸性条件下,亚硫酸氢根会结合到没有甲基化的C碱基的6位。而甲基化了的C碱基不会和亚硫酸氢根发生这个反应的。
- 然后,用碱来处理。结合了亚硫酸氢根的非甲基化的C,就被脱氨基,并且脱亚硫酸根。然后,就被转化成U碱基。
- 那么,甲基化或者羟甲基化的C碱基,因为之前没有和亚硫酸氢根起反应,所以现在用碱来处理,它也不会发生脱氨基反应。所以,它还保持了是“C”。
- 用亚硫酸氢盐来处理DNA,可以让99%左右的非甲基化的C碱基变成U。
- 也就是说这种方法的的转化效率非常高,转化效率达到了99%。
- 它的优点,就可以让我们接下来通过高通量测序的方法,可以精确地看到单个碱基的甲基化的水平。
- 经过亚硫酸氢盐转化过的DNA,再经过PCR,PCR新合成出来的链,U碱基的位置,就会被替换成了“T”。那么在接下来的测序过程中,测到的也是T碱基。
- 而甲基化的C,因为没有被亚硫酸氢盐所转化,所以,在接下来的测序过程中,被测到的,还是“C”碱基。
-
这样,通过测序,看一个位置是“C”,还是“T”。如果它保持是“C”,就说明这个位置是被甲基化、或者羟甲基化了。如果测到的是“T”,就说明这个位置是没有被甲基化、或者羟甲基化。
image.png
- 建库方法:
- 接下来,我们谈一下甲基化的建库过程。
- 先说第一种,用Illumina公司的Truseq DNA建库方法,来做甲基化测序。
- 因为Illumina Truseq DNA建库试剂盒当中,它所提供的接头,那么这个接头上的C碱基都是已经经过甲基化修饰了。
- 所以,用这些接头做出来的文库,在用亚硫酸氢盐做转化的过程当中,它的(接头上的)C还是保持是C ,不会被转成U。
-
带了这些接头的文库分子,就可以和测序芯片上的草皮DNA发生互补杂交。并且进一步发生桥式PCR反应。生成测序用的DNA的簇(Cluster)。
image.png - 但是,这个方法有一个缺点,就是在用亚硫酸氢盐处理DNA文库的时侯,90%以上的DNA链会断掉。这样,已经建好的文库,其中90%分子会被破坏掉。也就是说文库的丰富度就会损失90%以上。
- 那么,相应的它有它的好处,它的好处就是,在这个建库过程当中用的PCR循环数较少。所以它PCR扩增效率不同,所引起的文库不均一程度也就较低。也就是我们通常所说的PCR bias较少。
接下来,再说第二种建库方法。
-
为了解决文库丰富度受到损失的这个问题,EpiCentre公司开发了EpiGnome方法,方法的操作过程如图。
image.png
第1步,亚硫酸氢盐先处理DNA,把未甲基化的C都转变成U。
第2步,把带标签1的随机引物加入,进行第一次的复制。得到第1条的复制链。
第3步,是消化掉过量的引物。
第4步,是加入带末端终止碱基、并带标签2的随机引物。这个引物的作用是让第1复制链延伸,并且加上标签2。
第5步是加入建库的PCR引物,进行PCR。通过PCR,把Index序列和成簇引物序列加入到链的两侧。得到真正的文库。 - 这个方法的优点是,把亚硫酸氢盐处理的过程,放在了建库之前。这样建成的库的丰富程度会比较高。但是这个方法也有缺点,缺点就是要做较多的PCR循环,那么有了比较多的PCR循环之后,PCR产物的扩增均一性是不太好的。也就是说PCR bias会比较大。
- 上述两种方法,各有优缺点。
- 因为甲基化文库中经过亚硫酸氢盐处理,绝大多数的C都变成了T。所以,这个文库中是严重地缺少C碱基的,也就是四种碱基的比例是严重不平衡的。这样在用HiSeq 2000或2500测序仪来测甲基化文库的过程当中,文库测序得到的数据质理就较差。并且经过PF过滤得到的有效的数据产量也会较低。
- 为了弥补甲基化文库的碱基不平衡性,一般情况下,在上机过程当中,是掺入大比例的基因组文库,或者PhiX文库,来补充比较多的C碱基,一般会掺30%的PhiX文库、或者基因组文库。
- 在掺入30%的PhiX文库的条件下,一条HiSeq 2000 V3 PE100的Lane,大概可以得到20G 左右的甲基化文库数据。
- 也就是说,在HiSeq 2000或者2500平台上,甲基化文库的测序数据产量,一直都不是很高。质量也比较低。
5. 羟甲基化测序
DNA羟甲基化,会参与去甲基化工程,在肿瘤中表达显著降低
image.png
- 接下来,我们说一下区分“羟”甲基化和甲基化的测序方法。
- 在用单纯的亚硫酸氢盐法来测的过程当中,甲基化和差甲化的C碱基都不能被转化成U碱基,所以单纯的亚硫酸氢盐法是无法区分甲基化或羟甲基化的C碱基的。
- 为了区分甲基化和羟甲基化,科学家想出了两种办法。
- 第一种办法,是通过高钌酸钾(KRuO4)来氧化羟甲基化的C。羟甲基化的C可以被转化成甲酰化的C碱基,而甲酰化的C碱基,是可以被亚硫酸氢盐转化成U的。
- 而甲基化的C,不会被转化成U。这样就把原来的羟甲基化的C和甲基化的C给区分开来了。
- 经研究表明,用高钌酸钾氧化的方法来氧化羟甲基化的C,其转化效率是94%左右。也就是说,每100个羟甲基化的C中,有94个会被高钌酸钾转化成甲酰化的C。并进一步被亚硫酸氢盐转化成U。
-
同时,原来的甲基货摊C,只有2.1%会被转化成甲酰化的C。
image.png - 第二钟区分羟甲基化C的方法,是用糖基把羟甲基化的C给保护起来。然后用TET蛋白(Ten-eleven translocation methylcytosine dioxygenase 1),把甲基化的C转化成羟基化的C。
-
进一步将羟甲基化的C转化成甲酰化的C和羧基化的C。甲酰化的C和羧基化的C都可以被亚硫酸氢盐转化成U。
image.png - 而之前被糖基化保护起来的羟甲基化的C,是不会被TET蛋白转化成甲酰化的C或者羧基化的C的。在亚硫酸氢盐的处理过程中,它还保持是C。并且在之后的PCR扩增产物中,也表现为C。
- 这样,就可以把羟甲基化的C,和甲基化的C,给区分开来。
- 用这个方法,没有甲基化的C,99.6%都被转化成了U。甲基化的C,97.7%都被转化成了U。而羟甲基化的C,只有8%被化成了U。
- 也就是说92%的羟甲基化的C得到了糖基的保护,还保持了C。
- 上述,就是目前2个区分羟甲基化的C和甲基化C的方法。