VCF 处理

2023-11-26  本文已影响0人  孟令君

vcf格式文件处理大全

image.png

bcftools view A1.vcf -O b -o A1.bcf.gz
-o:输出结果文件
-O:数据文件格式

多个区域需要bed文件。
bcftools view A1.bcf.gz -R region.bed

bcftools stats
plot-vcfstats

使用bcftools的query功能筛选。
每个关键字前面使用%,“\t”或者“\n”代表制表符与换行符。

变异检测的策略一般是先找全,然后在找准。也就是软件首先输出尽可能多的结果,保存到vcf文件中,然后在采取不同的标准对vcf进行过滤。过滤可以采取很多的标准,一般包括测序深度,打分制,碱基质量值,先验概率等。可以使用bcftools的filter功能,关键是要掌握其表达式EXPRESSIONS的写法。

主要是将突变位点定位到基因组上,确定突变发生在哪个基因。另外一种注释就是与已知突变位点进行比较,定位到已知的rs number号上面。

bcftools annotate -

snpeff主要用来预测snp突变的影响,包括氨基酸变化等
snpsift的功能是用来操作变异结果文件,需要使用相关数据库。

主要用于构建系统发育树。
bcftools consensus

VQSR是Variant Quality Score Recalibration,是GATK的核心功能,也就是利用机器学习算法对vcf进行过滤。

上一篇 下一篇

猜你喜欢

热点阅读