甲基化测序 -- 重亚硫酸盐法和TAPS两种方法
DNA甲基化,即在不改变碱基类型和DNA序列的前提下,在某些碱基上加上甲基的过程。它属于表观遗传学范畴,主要通过影响基因表达而改变生物体的性状。基因甲基化的结果,一般是使甲基化位点下游的基因表达量减少。今天在这里主要总结一下应用在测序中的甲基化检测方法:重亚硫酸盐法和TAP法。
1. 重亚硫酸盐法
1.1 检测原理
原理:重亚硫酸盐能够将C碱基转化成U碱基,而甲基化修饰后的C碱基不会和重亚硫酸盐发生反应,能够在重亚硫酸盐处理中,一直保持C碱基的状态。因此在对测序数据的比对中,但凡检测到的C碱基均表明该位置的C为甲基化修饰过的C。
1.2 两种建库方法
-
Illumina 公司的 Truseq DNA建库方法 (先建库,后转化)
也就是说,待检测的DNA样品首先要按照正常的建库流程:打断获得DNA片段(200bp左右)--> DNA末端修复并加入ploy A尾 --> 加入接头
屏幕快照 2019-10-07 下午10.53.29.png
Illumina Truseq DNA建库试剂盒当中,它所提供的接头都已经经过甲基化修饰了,因此可以保证接头上的C还是保持C,不会被转化成U,从而保证它可以和固定在flowcell上的DNA接头互补杂交,通过发生桥式PCR反应、成簇进行测序。
这种方法最大的缺点:构建好的文库使用重亚硫酸盐处理时,90%以上的DNA链会断掉(伤敌一千自损八百)。因此文库的丰富度会损失90%以上,同时便要求样品量足够高。
这种方法的好处:建库过程中用的PCR循环数较少,所以它PCR扩增效率不同,引起的文库不均一程度较低,也就是PCR偏好性低。
- EpiGnome 方法
1.重亚硫酸盐先处理DNA,把未甲基化的C都转变成U
。。。
优点:把重亚硫酸盐处理的过程放在了建库前,这样建成的库的丰富程度会比较高。
缺点:要做较多的PCR循环,这样PCR产物的扩增均一性不是太好,PCR偏性较大。
Hiseq 2000 /2500 测甲基化文库的问题和解决方案
对于Illumina的HiSeq2000或者2500平台上进行测序,如果文库是 碱基平衡 的文库(也就是A/C/G/T四种碱基的比例各占25%左右的文库),测序仪对碱基的判读会比较好。
而甲基化的C毕竟占比不高,这种将正常C转化成U的方法无疑使最终上机的DNA文库碱基不平衡,这样在使用Hiseq 2000 /2500测序仪来测甲基化文库的过程中,文库测序得到的数据质量就很差,并且经过过滤得到的有效数据质量也会较低。实际上机过程中,为了弥补甲基化文库的碱基不平衡,通常会掺入大比例(一般为30%)的基因组文库、或者PhiX文库,来补充较多的C碱基。
-
设置内参
由于重亚硫酸盐对未甲基化的C的转化效率不是100%(一般99%左右),为了对实验的转化效率进行控制。一般会在转化实验中加入1%内参对照品:λDNA(甲基化酶缺陷型的大肠杆菌所生产出来的完全没有甲基化的DNA) 或 pUC19 DNA(质粒)来看转化效率。(同样可以通过用甲基化酶处理过的,CpG岛完全被甲基化的DNA)来追踪甲基化DNA对重亚硫酸盐转化的抵抗效果。 -
数据分析(需要做两次转换)
测序出来的序列在和基因组进行对比时,直接对比是比对不上的。
-- 把 参考基因组 上所有的C都改成T,和测序序列进行对比
-- 把 参考基因组 上所有的G都改成A,和测序序列进行对比
比对上之后,再寻找reads中的C碱基,标记他们的坐标,这些便是我们寻找的甲基化的C碱基。
TAPS甲基化测序
TAPS 英文全称 "TET-assisted pyridine borane sequencing",TET协助的吡啶硼烷测序。TET(ten-eleven translocation)指的是“10-11转位酶”,TET酶能够把甲基化的C碱基转化成羧基化的C碱基。原理:接着在吡啶硼烷作用下把羧基化的C转化成二氢尿嘧啶(也就是多两个H原子的U碱基),二氢尿嘧啶在PCR和测序过程当中,都会识别成T。
可以通过对比转化前后哪些C碱基被转化成了T,就可以知道哪些C是被甲基化了的。
TAPS的假阴性率 2.7%-3.5%,假阳性率0.23%
优点:
- TAPS方法对DNA的破坏很小,可以保持10KB以上的长链DNA。
- 只要1ng的DNA量就能建库,相比重亚硫酸氢盐的方法少了一千倍(1ug DNA)
- TAPS得到的DNA文库复杂度高(仅把占比很小的甲基化C进行了改变,对DNA的天然序列改变很小,碱基平衡),对Illumina测序仪更加友好,数据质量较高,有效数据量增加
- 可以使用通用的BWA序列比对方法完成序列比对工作(重亚硫酸盐法得到的数据,因为大量的C碱基都被改成了T,所以要用特殊的软件来分析,例如Bismark软件)
文章🔗 Bisulfite-free direct detection of 5-methylcytosine and 5-hydroxymethylcytosine at base resolution