Bismark

2024-12-17  本文已影响0人  可能性之兽

Bismark 是一个用于处理甲基化测序数据的工具,特别是针对二硫化处理的 DNA 测序数据。它的主要功能是将测序读段比对到参考基因组,并提取甲基化信息。以下是 Bismark 的基本原理和工作流程:

1. 二硫化处理的背景

在二硫化处理的过程中,DNA 样本会经过化学处理,使得未甲基化的胞嘧啶(C)转变为尿嘧啶(U),而甲基化的胞嘧啶则保持不变。在后续的 PCR 扩增和测序过程中,尿嘧啶会被替换为胸腺嘧啶(T),因此在测序数据中,甲基化和未甲基化的胞嘧啶会以不同的方式表现出来。

1. 亚硫酸氢盐处理 (Bisulfite Treatment) 的化学反应:

2. 测序过程 (Sequencing):

3. 综合理解:

说明:

假设我们有一段 DNA 序列:

原始 DNA:  5'-ATGC**C**G**5mC**G**C**T-3'

其中,加粗的 C 表示胞嘧啶,5mC 表示甲基化的胞嘧啶。

  1. 亚硫酸氢盐处理后:
处理后 DNA: 5'-ATGU**U**G**5mC**GU**U**T-3'
  1. 测序后 (U 被读作 T):
测序结果:  5'-ATG**T**TG**C**GT**T**T-3'
  1. 与原始基因组比较:
原始 DNA:  5'-ATGC**C**G**5mC**G**C**T-3'
测序结果:  5'-ATG**T**TG**C**GT**T**T-3'

通过比较,我们可以发现:

一句话总结:最后能够测到的C都是甲基化的

2. Bismark 的工作流程

Bismark 的工作流程主要包括以下几个步骤:

a. 生成双链比对基因组

Bismark 首先会根据参考基因组生成一个双链比对的基因组索引。这一过程会考虑到二硫化处理的影响,生成两个版本的基因组:一个是原始的参考基因组,另一个是将所有的 C 替换为 T 的版本。

b. 比对测序读段

接下来,Bismark 使用比对工具(如 Bowtie2)将测序读段比对到上述生成的双链基因组索引中。比对的结果会生成一个 BAM 文件,记录每个读段在基因组中的位置。

c. 提取甲基化信息

在比对完成后,Bismark 会分析 BAM 文件,提取每个胞嘧啶的甲基化状态。具体来说,它会检查每个 C 的位置,判断其在测序读段中的表现(是 C 还是 T),从而推断出该位置的甲基化状态。

d. 输出结果

最后,Bismark 会将提取的甲基化信息输出为不同格式的文件(如 bedGraph、Methylation Calls 等),供后续分析使用。

3. 结果分析

Bismark 生成的结果可以用于多种下游分析,例如:

上一篇 下一篇

猜你喜欢

热点阅读