2021-03-31 为VCF文件建立索引(.idx)
问题背景:
做GWAS分析,对方只提供了具有SNP和indel的vcf文件,需要提取SNP时,提取时去发现,需要对应的索引(.idx)
这种情况下可否不去要求对方提供.idx文件,生成一个新的进行分析?
通过网上查询发现通过bcftools和GATK都可以生成。
1.尝试bcftools(参考文献:https://www.cnblogs.com/xiaofeiIDO/p/8294998.html ;bcftools 为 vcf 文件建索引及合并 vcf 文件)
通过conda安装bcftools;然后尝试bcftools,发现无法用bcftools,原因是缺相(libcrypto.so.1.0.0,真他妈心碎,旧问题没解决出现新的问题!!!报错如图)
尝试寻找,解决方法(1.https://blog.csdn.net/u012000056/article/details/52671474 ;libssl1.0.0或者libcrypto.so.1.0.0库的问题解决方法 2. https://www.jianshu.com/p/e7d472375574 (没看明白放弃))
1.方法:需要安装libssl1.0.0;conda不给力、而且部分用户是因为ssh不行出现这个问题(https://blog.csdn.net/zhengxiuchen86/article/details/105611158),难道这个会影响shh,目测可能会造成更大问题,搞不好的话。所以放弃了!!!!
2.尝试GATK建立索引。
但是怎么用不知道,可以肯定的是借助IndexFeatureFile命令;有些网上说是用gatk IndexFeatureFile -F variant.vcf (https://www.jianshu.com/p/a3b3c6190d35),但是参数不识别报错;有些说用$java -jar $gatk IndexFeatureFile --feature-file $dbSNP_vcf (https://zhuanlan.zhihu.com/p/70763177),哈哈哈也不行,参数不识别;报错提示用input??用input可以运行了。皆大欢喜!(最后命令为:gatk IndexFeatureFile -I XXX.vcf).
参数应用各个人都不一样或许是软件不断更新的缘故!!!但是就是总结的话,就是别乱找网上的问题,好好看看报错,解决不了,在满世界找!(好像也有一个人用对了命令,但是遇到了其他问题,https://www.omicsclass.com/question/2229,不能幸免这个问题,我也遇到了;都是坑啊)