SnpHub搭建 | 数据处理中可能出现的问题
2020-07-21 本文已影响0人
esctrionsit
1. VCF文件中出现了position顺序不对(未排好序)
使用bcftools sort
进行排序
bcftools sort xxx.vcf -Oz -o xxx.sorted.vcf.gz
2. bcftools在写文件时,因为contig未出现在header中而报错
使用bcftools reheader
的-f
参数,将参照基因组fasta的fai索引文件中的contig信息加入vcf的header中。
bcftools reheader -f ref.fasta.fai xxx.vcf.gz -o xxx.reheadered.vcf.gz
-f
参数似乎是较新版本的bcftools才加入的参数,在1.8版本的bcftools上提示无此参数,而1.10版本可以使用。
也可以手动编辑文件头,并将新文件头替换至vcf
bcftools view xxx.vcf.gz -h > header.txt
vi header.txt
bcftools reheader -h header.txt xxx.vcf.gz -o xxx.reheader.vcf.gz