deeptools可视化
ref1:deeptools辅助CHIP-seq数据分析-可视化 | 生信菜鸟团
ref2:如何使用deeptools处理BAM数据 - 生信技能树
ref3:The tools — deepTools 3.1.3 documentation
第一个功能,把bam文件转换为bw格式文件:
bamCoverage -b tmp.sorted.bam -o tmp.bw
peak分布可视化
为了统计全基因组范围的peak在基因特征的分布情况,需要用到computeMatrix计算,用plotHeatmap以热图的方式对覆盖进行可视化,用plotProfile以折线图的方式展示覆盖情况。
computeMatrix具有两个模式:scale-region和reference-point。前者用来信号在一个区域内分布,后者查看信号相对于某一个点的分布情况。
computeMatrix scale-regions -b 3000 -a 3000 --regionBodyLength 5000-p 25 \
-R mm10_Gencode_VM18.bed \
-S *.bw \
--skipZeros \
--outFileName matrix.gz
结果可视化
可视化的方法有两种,一种是轮廓图,一种是热图。两则都提供了足够多的参数对结果进行细节上的修改。
plotProfile -m matrix.gz \
-out plotProfile.png \
--numPlotsPerRow 2 \
--plotTitle "profile"
--numPlotsPerRow NUMPLOTSPERROW : Number of plots per row (default: 8)
##########################################################
plotHeatmap \
-m matrix.gz \
-out plotHeatmap.png \
--plotTitle "Heatmap"
构建bed:
安装:
sudo apt install bedops
命令:
1.先下载TAIR10_GFF3_genes.gff3,
2. 然后convert2bed --input=gff [--output=bed] <TAIR10_GFF3_genes.gff> TAIR10_GFF3_genes.bed
3. 但是,computeMatrix 识别的bed文件只要前三列
cut -f 1-3 TAIR10_GFF3_genes.bed > ref.bed
4. 再跑computeMatrix就可以了
我用的Rseqc的bed