ChIP-seqATAC-seqATACSeq 开放染色质分析

第3篇:用MACS2软件call peaks

2018-08-24  本文已影响74人  六六_ryx

学习目标:

Peak Calling

Peak calling即利用计算的方法找出ChIP-seq或ATAC-seq中reads富集的基因组区域。



如下图所示,比对结果的文件中reads在正负链不均匀分布,但在结合位点聚集。正负链5‘末端的reads各形成一组合,通过统计学的方法评估这些组合的分布并和对照组比较,确定这些结合位点是否是显著的。


NOTE:ChIP-seq的分析方法可以鉴定两种类型的富集模式:broad domainsnarrow peaks。broad domains,如组蛋白修饰在整个基因body区域的分布;narrow peak,如转录因子的结合。narrow peak相对于broad 或者分散的marks更易被检测到。也有一些混合的结合图谱,如PolII包括narrow和broad信号。


MACS2

peaks calling 有不同的方法,MACS2是最常用的call peaks工具。 MACS全称Model-based Analysis of ChIP-Seq,最初的设计是用来鉴定转录因子的结合位点,但是它也可以用于其他类型的富集方式测序。
MACS通过整合序列标签位置信息和方向信息提高结合位点的空间分辨率。MACS的工作流如下所示:


MACS2的使用方法

MACS2的用法,call peaks的参数及输出文件的解读可以参考MACS2文档学习

了解相关参数:

输入文件参数:

输出文件参数:

peak calling 参数

q值与峰宽有一定的联系。理想情况下,如果放宽阈值,您将简单地获得更多的峰值,但是使用MACS2放松阈值也会导致更宽的峰值。

Shift 模型参数:

  1. 想找富集剪切位点,如DNAse-seq,所有5'端的序列reads应该从两个方向延伸,如果想设置移动的窗口是200bp,参数设置如下:
    --nomodel --shift -100 --extsize 200
  2. 对nucleosome-seq数据,用核小体大小的一半进行extsize,所以参数设置如下:
    --nomodel --shift 37 --extsize 73

ATAC-Seq call peaks示例

ATAC-seq关心的是在哪切断,断点才是peak的中心,所以使用shift模型,--shift -75或-100
对人细胞系ATAC-seq 数据call peak的参数设置如下:

macs2 callpeak -t H1hesc.final.bam -n sample --shift -100 --extsize 200 --nomodel -B --SPMR -g hs --outdir Macs2_out 2> sample.macs2.log

MACS2输出文件解读

Remove the beginning track line if you want to analyze it by other tools.???


summits.bed,narrowPeak,bdg, xls四种类型输出文件的比较:


参考资料:

HBC的深度NGS数据分析课程
MCAS2文档

上一篇下一篇

猜你喜欢

热点阅读