PART2 6mA-seq
2022-07-06 本文已影响0人
小qqq
1.比对
用bowtie 比对
#下载软件
conda install -y bowtie bowtie2
#激活环境
conda activate atac
vim bowi.sh
head bowi.sh
bowtie2 -x /public/home/genome/bowtie_index -1 .fq.gz -2 .fq.gz |anaconda2/envs/chipseq/bin/samtools sort -@ 8 -O bam -o /6mA/cutadaptor/input.bam
bowtie2 -x /public/home/genome/bowtie_index -1 .fq.gz -2 .fq.gz |anaconda2/envs/chipseq/bin/samtools sort -@ 8 -O bam -o /6mA/cutadaptor/IP.bam
选用sambamba对来去重复
#sambamba去重复
sambamba markdup -r input.bam input.sambamba.rmdup.bam
sambamba markdup -r IP.bam IP.sambamba.rmdup.bam
smarttool对比对结果排序提取可靠的结果
#smarttool对比对结果排序
samtools sort -O bam -@ 4 -o ./input.fraw.bam input.sambamba.rmdup.bam
samtools sort -O bam -@ 4 -o ./IP.fraw.bam IP.sambamba.rmdup.bam
#smarttool提取可靠的比对结果
samtools view -f 2 -q 30 -o input.fraw.q30.bam input.fraw.bam
samtools view -f 2 -q 30 -o IP.fraw.q30.bam IP.fraw.bam
指定目录下输出一下文件:
blast.png2.macs2 calling peak
macs2 callpeak -f BAMPE -c input.fraw.bam -t IP.fraw.bam -p 0.05 -g 380699722 -n 6mAIP --outdir ./peak --nomodel -B --SPMR
#-t:实验组,IP的数据文件
#c: 对照组
#f:指定输入文件的格式,默认是自动检测输入数据是什么格式,支持bam,sam,bed等
#g:有效基因组大小,由于基因组序列的重复性,基因组实际可以mapping的大小小于原始的基因组。
#--outdir:输出结果的存储路径
#--n:输出文件名的前缀
#-B/--bdg:输出bedgraph格式的文件