Diamond构建本地nr蛋白库报错Error: Invalid

2022-12-14  本文已影响0人  田小田_8afd

w因课题需要,采用diamond构建本地nr蛋白库,运行了数小时后得到一个报错,报错信息为Error: Invalid taxonomic rank.

搜索半天没得到解决方法,最终通过微信群中的大佬指点迷津,得以解决。现将具体构建步骤和解决办法记录,以供大家参考。

一、nr数据库及tax信息下载

(1)nr.gz和nr.gz.md5  

linux下载方法:wget -c https://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nr.gz*

windows下载方法:Index of /blast/db/FASTA (nih.gov)

下载完成后,使用如下命令检查nr.gz的完整性

md5sum -c nr.gz.md5

(2)prot.accession2taxid.gz和taxdump.tar.gz下载(注意和nr)

wget  -c              https://ftp.ncbi.nlm.nih.gov/pub/taxonomy/accession2taxid/prot.accession2taxid.gz*

wget  -c     https://ftp.ncbi.nlm.nih.gov/pub/taxonomy/taxdump.tar.gz*

diamond下载

二、建库

diamond makedb --in nr.gz --db nr --taxonmap prot.accession2taxid.gz --taxonnodes nodes.dmp

其中nodes.dmp来自taxdump.tar.gz

报错:

Error: Invalid taxonomic rank.

解决办法:

更新diamond版本,原来diamond为0.9.3.1,更新为v2.0.15得以解决。

下载链接为https://github.com/bbuchfink/diamond/releases/(请务必下载与taxdump相匹配的版本)

上一篇下一篇

猜你喜欢

热点阅读