甲基化

BS-Seq(1) -- 背景介绍及实验原理

2022-08-11  本文已影响0人  Z_bioinfo

1.DNA 甲基化

DNA 甲基化是重要的表观遗传学修饰之一,以往的研究表明,DNA 甲基化在细胞发育和分化、调控基因表达、X 染色体失活、基因沉默、疾病的发生等方面扮演着重要的角色。在真核生物中,最常见的是在胞嘧啶的5号碳位置,在酶和底物的作用下,引入一个甲基基团,变成了5甲基胞嘧啶(5mC),从而改变了它的活性,胞嘧啶甲基化也可能会发生在CHG 和 CHH( H 是除 G 外的任意一种核苷酸) 上。


image.png

以往的研究发现,位于启动子区域的高甲基化的 CpG 岛与基因的沉默有关,可能是因为 DNA甲基化阻碍转录因子结合而直接抑制了基因转录。

2.基于二代测序技术的DNA甲基化检测技术

目前已经建立了至少三种DNA甲基化分析技术。包括甲基化DNA免疫共沉淀测序(methylated DNA immunoprecipitation sequencing,MeDIP-Seq)、甲基结合蛋白测序(methyl-binding protein sequencing,MBD-Seq)和重亚硫酸氢盐测序(也称为Bisulfite-Seq,BS-Seq或Methyl-Seq),其中MeDIP-Seq和MBD-Seq都是基于富集的原理,而BS-seq不经过富集可以直接进行测序。
重亚硫酸盐转换结合二代测序技术是目前最精准的 DNA 甲基化检测方法,能够检测单碱基水平的甲基化状态,被称为 DNA 甲基化检测的“金标准”。所以这里主要介绍BS-seq。
BS-seq原理
原理很简单,就是原始DNA序列在被亚硫酸盐处理后,未甲基化的C会变成U(随后的DNA复制中变成T),而甲基化的C(包括5mC, 5hmC)则不受改变。这是BS-seq的核心点,之后的序列比对也都是基于此。

image.png
测序 DNA BS 转化后经过 PCR 扩增发生了 C->T 转化,那么反向互补链则是 G->A 转化。普通DNA文库经过PCR扩增会生成正负2种链,并且这两条链是反向互补的,而经过亚硫酸盐处理后,DNA链由于C->T的转换导致两条链并不互补,所以经过PCR扩增后会形成正负4种链,即所谓的OT、CTOB、OB、CTOB。
image.png
上图中,
蓝色的核苷酸是被亚硫酸氢盐转化为尿嘧啶(U)的未甲基化的胞嘧啶(C)。
红色的核苷酸是对转化具有抗性的5-甲基胞嘧啶(5mC)。
总的来说,样本用 Bisulfite 处理,将基因组中未发生甲基化的 C 碱基转换成 U,进行PCR扩增后变成T,与原本具有甲基化修饰的 C 碱基区分开来,再结合高通量测序技术,与参考序列比对。
未甲基化的 C -> T
甲基化的 C -> C
BS-seq分类:全基因组亚硫酸氢盐测序(WGBS)、简化甲基化测序(Reduced representation bisulfite sequencing,RRBS)

最简单的方法是做全基因组亚硫酸氢盐测序(WGBS)。但是,你需要足够的read深度来准确的判断甲基化状态。当你要进行的测序是基于一个大基因组(小鼠或人)时,这可能导致测序的成本过高。

作为一种可选方法,你可以把检测DNA甲基化的重点放在基因组的一个特定子集上,从而减少实验的数据量和随后的成本。

一种流行的方法是Reduced Representation Bisulfite Sequencing (RRBS)。RRBS的基本思想是获得基因组的“简化表示(reduced representation)”,重点放在CpG岛上。这包括在裂解阶段添加限制性内切酶来消化DNA。通常,使用的MspI酶是甲基化不敏感的。它在5 ' -C^CGG-3 '位点剪切,由于基因组除启动子/CpG岛外,CpGs大量缺失,“简化表示”主要是只捕获这些启动子区域以供进一步分析。消化反应对两端都有CpG的DNA片段和大小不一的片段进行富集。然后填充片段末端并连接adapters。之后选择片段的大小,进行亚硫酸氢盐转换,并进行测序。
甲基化测序流程
得到* DNA* 样品后,首先对样品进行质量检测。样品质量检测合格后,进行 BS 文库构建,具体步骤如下:
方法一:该文库为链特异性文库,使用bismark默认参数比对即可。
1.基因组 *DNA *超声打断成 100-300bp 的片段

2.DNA 片段末端修复、3’端加 A 碱基,连接测序接头;

3.采用 ZYMO EZ DNA Methylation-Gold kit 进行Bisulfite 处理;

4.脱盐处理后切胶回收,并进行文库片段大小选择,PCR 扩增后再次进行文库片段大小选择;文库构建完成后,对文库进行质量检测。质检合格的文库将用于上机测序。


image.png

5.将测序结果与参考基因组比对,比对上唯一位置的序列用于后续标准信息分析及个性化分析。得到下机数据后,首先进行数据过滤,去掉低质量数据。

6.得到可用数据。完成数据过滤后,需检测可用数据量是否符合合同要求。检测合格后,将可用数据与参考基因组进行比对,得到比对结果。在确认比对质量合格后,使用唯一比对数据得到全基因组* C* 碱基甲基化信息,进行信息分析处理,得到标准信息分析结果和个性化分析结果。

方法二:先CT转换,然后扩增加接头,如下图。


image.png

通常而言,甲基化建库均为链特异性方式构建:

测序read1都是来自于原始的基因组,经历了C->T转化,来自于正链的叫OT,负链叫OB;
测序read2都是来自于原始基因组的互补链,经历了G->A转换,称之为CTOT或者CTOB。
数据处理流程

image.png
上一篇下一篇

猜你喜欢

热点阅读