取两个VCF的差集
2022-05-12 本文已影响0人
橙子_orange
参考:https://www.biostars.org/p/113509/#113509
https://samtools.github.io/bcftools/bcftools.html#isec
bcftools isec [option] A.vcf.gz B.vcf.gz […]
创建A和B的交集和补集,将输出保存在 dir/*
bcftools isec -p dir A.vcf.gz B.vcf.gz
过滤存在于A(需要 INFO/MAF>=0.01)和 B(需要 INFO/dbSNP)但不在C 的位点,并创建交集,仅包括过滤后出现在至少两个文件中的位点
bcftools isec -e'MAF<0.01' -i'dbSNP=1' -e- A.vcf.gz B.vcf.gz C.vcf.gz -n +2 -p dir
精确匹配等位基因,从A中提取A和B共有的位点
bcftools isec -p dir -n=2 -w1 A.vcf.gz B.vcf.gz
提取 A 或 B 私有的位点,仅按位置进行比较
bcftools isec -p dir -n-1 -c all A.vcf.gz B.vcf.gz
print存在于 A 和 B 但不存在于 C 和 D 中的列表
bcftools isec -n~1100 -c all A.vcf.gz B.vcf.gz C.vcf.gz D.vcf.gz
提取只存在于A而不存在于其他文件中的position
bcftools isec -C A.vcf.gz B.vcf.gz