ChIP-seqATAC-seqATACSeq 开放染色质分析

第8篇:用网页版工具做功能分析和motif分析

2018-09-03  本文已影响15人  六六_ryx

上一篇介绍了使用ChIPseeker对peaks的分布和邻近基因的注释。除此之外,下游分析通常还包括鉴定我们感兴趣的蛋白质结合的motif;鉴定这些结合区域的基因以及这些基因的富集通路或网络。

学习目标

准备文件

提取IDR结果文件的前3列

cut -f 1,2,3 Nanog-idr-merged.bed  > Nanog-idr-merged-great.bed

使用bedtools getfasta提取peaks的序列

bedtools getfasta -fi \
ref_genome.fa \
-bed Nanog-idr-merged-great.bed \
-fo Nanog-idr-merged-dreme.fasta

富集分析

GREAT(http://bejerano.stanford.edu/great/public/html/index.php)对peaks的功能注释是对peaks临近基因的注释。
方法:


找Motif

motif是比较有特征的短序列,会多次出现的,并被假设拥有生物学功能。而且,经常是一些具有序列特异性的蛋白的结合位点(如转录因子)或者是涉及到重要生物过程的(如,RNA 起始,RNA 终止, RNA 剪切等等)。
有很多网页版工具提供了找motif的方法,2014年的一篇综述列出了目前常用的网页工具(https://doi.org/10.1186/1745-6150-9-4 ):


最常用的有MEME工具套件,下面主要介绍DREME。DREME适用于大批量的ChIP-Seq数据找真核转录因子短的(4nt或8nt)核心DNA结合基序。

DREME

MEME-ChIP

MEME-ChIP是MEME套件中的另一个工具,可以实现DREAM和Tomtom的分析功能,还可以评估motifs的中心富集性并整合相关的motifs合成相似性簇。MEME-ChIP能够鉴定更长的motifs(<30bp),但是运行时间比较长。


另外可以用Homer找motif,详细用法参考找个motif嘛,简单

参考资料

  1. 哈佛深度NGS数据分析课程, 08-Web-based functional analysis and motif discovery
  2. 找个motif嘛,简单
上一篇 下一篇

猜你喜欢

热点阅读