群体遗传学重测序重测序及SNP分析

群体变异数据vcf文件过滤概念及使用方法

2020-05-19  本文已影响0人  点滴生信

标记过滤指标概念

gatk标记硬过滤

gatk VariantFiltration \
    -V snps.vcf.gz \
    -filter "QD < 2.0" --filter-name "QD2" \
    -filter "QUAL < 30.0" --filter-name "QUAL30" \
    -filter "SOR > 3.0" --filter-name "SOR3" \
    -filter "FS > 60.0" --filter-name "FS60" \
    -filter "MQ < 40.0" --filter-name "MQ40" \
    -filter "MQRankSum < -12.5" --filter-name "MQRankSum-12.5" \
    -filter "ReadPosRankSum < -8.0" --filter-name "ReadPosRankSum-8" \
    -O snps_filtered.vcf.gz
gatk VariantFiltration \ 
    -V indels.vcf.gz \ 
    -filter "QD < 2.0" --filter-name "QD2" \
    -filter "QUAL < 30.0" --filter-name "QUAL30" \
    -filter "FS > 200.0" --filter-name "FS200" \
    -filter "ReadPosRankSum < -20.0" --filter-name "ReadPosRankSum-20" \ 
    -O indels_filtered.vcf.gz

vcftools 群体标记过滤

vcftools \
--minDP 4 \
--maxDP 100 \
--minGQ  10 \
--minQ 30 \
--min-meanDP 3 \
--out meanDP3.miss0.5.maf0.01.vcf \
--vcf raw.vcf \
--recode --recode-INFO-all \
--max-missing 0.5 \
--maf 0.01
上一篇下一篇

猜你喜欢

热点阅读