diamond序列比对参数设置

2019-05-21 本文已影响0人赵会成

diamond makedb --in name.fasta -d name

diamond blastx --db name --query reads.fq.gz --out reads.tab

diamond blastp --db name --query proteins.fasta --out nr.tab --outfmt 6 --sensitive --max-target-seqs 20 --evalue 1e-5 --id 30 --block-size 20.0 --tmpdir /dev/shm --index-chunks 1

比对参数：

--sensitive 添加该参数，则能得到更多比对结果。该模式适合比对较长的序列。默认模式主要适用于比对short reads序列（Illumina reads），搜寻比对长度为30~40aa且bit得分大于50的匹配结果。

--more-sensitive 相比于sensitive，能得到更全的比对结果。

性能参数：

--threads | -p default: Max 设置程序运行所使用的CPU线程数。默认是可用的最大CPU线程数。

--block-size | -b default: 2.0 设置每次处理多少G的序列字符数。默认设置下，程序一次处理2G个序列字符，消耗内存12G。

--tmpdir | -t default: directory of --out 设置临时文件夹路径。若将该参数设置为/dev/shm，则会将临时文件存放在内存，会增加内存消耗和计算性能。

--index-chunks | -c default: 4 将seed index分成指定的份数。推荐将该参数值设置成1，能增加计算性能和内存使用量。

DIAMOND默认设置下输出表格格式的结果。结果分12列，其结果信息和BLAST默认设置-outfmt 6输出的格式完全一致。

1. query序列ID

2. subject序列ID

3. Identity百分比

4. 匹配长度

5. 错配长度

6. 打开Gap的次数

7. query序列起始位点

8. query序列结束位点

9. subject序列起始位点

10. subject序列结束位点

11. E-vaule值

12. bitscore得分

参考

http://www.chenlianfu.com/?m=20190407

http://www.chenlianfu.com/?p=2703

https://www.biostars.org/p/382554/

diamond序列比对参数设置

猜你喜欢

热点阅读