GWAS

SAMtools——bam文件去重

2022-02-03  本文已影响0人  Wei_Sun

在对bam文件进行排序后,需要去除重复序列,以减少后续分析的计算压力。

sam文件转换为bam文件——SAMtools - 简书 (jianshu.com)

SAMtools——bam文件排序 - 简书 (jianshu.com)

1. 标记重复序列

$ gatk MarkDuplicates -I LPF1_R1_MP.rg.sort.bam -O LPF1_R1_MP.rg.sort.marked.bam -M LPF1_R1_MP.rg.sort.dups.txt

2. 去掉重复序列

picard安装:
picard——修改BAM文件的Read Group - 简书 (jianshu.com)

$ picard MarkDuplicates \
       REMOVE_DUPLICATES=true  \
       I= LPF1_R1_MP.rg.sort.marked.bam \
       O= LPF1_R1_MP.rg.sort.dup.bam \
       M= out.txt

3.生成索引

$ samtools index LPF1_R1_MP.rg.sort.dup.bam

引用转载请注明出处,如有错误敬请指出。

上一篇 下一篇

猜你喜欢

热点阅读