数据分析一起生信啦啦啦

deeptools可视化

2018-11-29  本文已影响130人  苏牧传媒

ref1:deeptools辅助CHIP-seq数据分析-可视化 | 生信菜鸟团

ref2:如何使用deeptools处理BAM数据 - 生信技能树

ref3:The tools — deepTools 3.1.3 documentation

第一个功能,把bam文件转换为bw格式文件:

bamCoverage -b tmp.sorted.bam -o tmp.bw

peak分布可视化

为了统计全基因组范围的peak在基因特征的分布情况,需要用到computeMatrix计算,用plotHeatmap以热图的方式对覆盖进行可视化,用plotProfile以折线图的方式展示覆盖情况。

computeMatrix具有两个模式:scale-region和reference-point。前者用来信号在一个区域内分布,后者查看信号相对于某一个点的分布情况。

computeMatrix scale-regions -b 3000 -a 3000 --regionBodyLength 5000-p 25 \

-R mm10_Gencode_VM18.bed \

-S *.bw \

--skipZeros \

--outFileName matrix.gz

结果可视化

可视化的方法有两种,一种是轮廓图,一种是热图。两则都提供了足够多的参数对结果进行细节上的修改。

plotProfile -m matrix.gz \              

-out plotProfile.png \              

--numPlotsPerRow 2 \              

--plotTitle "profile"

--numPlotsPerRow NUMPLOTSPERROW :  Number of plots per row (default: 8)

##########################################################

plotHeatmap \

-m matrix.gz \      

-out plotHeatmap.png \

--plotTitle "Heatmap"

构建bed:

安装:

sudo apt install bedops

命令:

1.先下载TAIR10_GFF3_genes.gff3, 

2. 然后convert2bed --input=gff [--output=bed] <TAIR10_GFF3_genes.gff> TAIR10_GFF3_genes.bed

3. 但是,computeMatrix 识别的bed文件只要前三列

cut -f 1-3 TAIR10_GFF3_genes.bed > ref.bed

4. 再跑computeMatrix就可以了

我用的Rseqc的bed

上一篇下一篇

猜你喜欢

热点阅读