GATK学习笔记

2018-11-16  本文已影响0人  浩瀚之宇
  1. BaseRecalibrator
    该GATK模块用来检测碱基质量分数中的系统错误。由于原始数据中可能存在一些测序仪器产生的系统性误差,那么变异位点识别过程中找到的变异位点就会存在假阳性的位点。该程序利用机器学习的方式调整原始碱基的质量分数, 即为碱基质量分数重校准(Base quality score recalibration,BQSR)。该模块的分析过程分为两个步骤: 1)利用已有的snp数据库,建立相关性模型,产生重校准表( recalibration table);2) 根据这个模型对原始碱基进行调整,仅调整非已知SNP区域。

输入

需要重校准的BAM文件
已知的多态性位点数据库,用于屏蔽那些不需要重校准的部分

输出

GATK可能会报告许多表格:

参数列表
量化质量表
每个read gruop的重校准表
按质量得分的重校准表
所有可选协变量的重校准表
gatk --java-options "-Xmx20G -Djava.io.tmpdir=./" BaseRecalibrator -R $ref -I ${sample}_marked_fixed.bam --known-sites $snp --known-sites $indel -O ${sample}_recal.table 1>${sample}_log.recal 2>&1 

参考
https://software.broadinstitute.org/gatk/documentation/
https://www.jianshu.com/p/0e6162104294

上一篇 下一篇

猜你喜欢

热点阅读