全基因组/外显子组测序分析基因组坐标区间操作

取两个VCF的差集

2022-05-12  本文已影响0人  橙子_orange

参考:https://www.biostars.org/p/113509/#113509
https://samtools.github.io/bcftools/bcftools.html#isec

bcftools isec [option] A.vcf.gz B.vcf.gz […]

创建A和B的交集和补集,将输出保存在 dir/*

bcftools isec -p dir A.vcf.gz B.vcf.gz

过滤存在于A(需要 INFO/MAF>=0.01)和 B(需要 INFO/dbSNP)但不在C 的位点,并创建交集,仅包括过滤后出现在至少两个文件中的位点

bcftools isec -e'MAF<0.01' -i'dbSNP=1' -e- A.vcf.gz B.vcf.gz C.vcf.gz -n +2 -p dir

精确匹配等位基因,从A中提取A和B共有的位点

bcftools isec -p dir -n=2 -w1 A.vcf.gz B.vcf.gz

提取 A 或 B 私有的位点,仅按位置进行比较

bcftools isec -p dir -n-1 -c all A.vcf.gz B.vcf.gz

print存在于 A 和 B 但不存在于 C 和 D 中的列表

bcftools isec -n~1100 -c all A.vcf.gz B.vcf.gz C.vcf.gz D.vcf.gz

提取只存在于A而不存在于其他文件中的position

bcftools isec -C A.vcf.gz B.vcf.gz
上一篇下一篇

猜你喜欢

热点阅读