生物信息学

HMMRATAC检测ATAC数据的开放性

2019-09-29  本文已影响0人  浩渺予怀

背景

目前,已经衍生出多种用于检测染色质开放性的试验方法。比如, DNase-seq, FAIRE-seq和ATAC-seq,其中ATACA-seq方法试验技术简单、快捷、重复性好,得到了极大的发展和使用。ATAC-seq技术核心是使用Tn5转座酶切割开放性的染色质,Tn5转座酶优先插入核小体free区域,产生的DNA片段长度小于100 bp;也可能插入到相邻的核小体之间,即linker-DNA区域,产生的DNA片段大约在150 bp。 尽管,针对 DNase-seq, FAIRE-seq和ChIP-seq的分析工具已经存在,也能用于ATAC-seq数据分析,例如:MACS2、F-seq等,然而这些工具存在不足,仅能利用部分插入片段信息,通常是核小体free区域。 NucleoATAC软件可以将ATAC-seq数据区分为核小体free和核小体两部分,然后可以进行核小体位置的定位。然而,NucleoATAC不能利用核小体信息进行peak calling。所以,目前没有一款工具可以同时进行核小体free区域和核小体信号的鉴定。

[图片上传失败...(image-3555f7-1567747354481)]

image.png

软件说明

HMMRATAC( Hidden Markov ModeleR for ATAC-seq ) 是一个半监督式机器学习方法。该软件采用了“分解和整合”的思路,首先把一套数据首先分解为来自于NFR 和核小体区域的不同覆盖信号层,然后在隐马尔可夫模型中学习开放染色质区域信号层之间的关系,用于预测开放染色质区域。该软件检测染色质结构更准确,相比其他软件优势明显。

一个典型的ATAC-seq分析思路如下:

  1. 使用Bowtie2或BWA软件进行数据比对

  2. 使用HMMRATAC鉴定全基因组染色质开放区域

  3. 使用MEME进行motif富集分析

  4. 使用 CENTIPEDE进行motif足迹分析

  5. 使用Diffbind进行差异开放性分析

  6. 使用BETA与基因表达进行联合分析

  7. ……

软件下载

[https://github.com/LiuLabUB/HMMRATAC](https://github.com/LiuLabUB/HMMRATAC)

软件使用

 java -jar HMMRATAC_V*_exe.jar -b <SortedBAM> -i <BAMIndex> -g <GenomeStatsFile> <options>

参数说明

必需参数:

参考资料

文章: https://doi.org/10.1093/nar/gkz533

软件: https://github.com/LiuLabUB/HMMRATAC

上一篇 下一篇

猜你喜欢

热点阅读