diamond序列比对参数设置
diamond makedb --in name.fasta -d name
diamond blastx --db name --query reads.fq.gz --out reads.tab
diamond blastp --db name --query proteins.fasta --out nr.tab --outfmt 6 --sensitive --max-target-seqs 20 --evalue 1e-5 --id 30 --block-size 20.0 --tmpdir /dev/shm --index-chunks 1
比对参数:
--sensitive 添加该参数,则能得到更多比对结果。该模式适合比对较长的序列。默认模式主要适用于比对short reads序列(Illumina reads),搜寻比对长度为30~40aa且bit得分大于50的匹配结果。
--more-sensitive 相比于sensitive,能得到更全的比对结果。
性能参数:
--threads | -p default: Max 设置程序运行所使用的CPU线程数。默认是可用的最大CPU线程数。
--block-size | -b default: 2.0 设置每次处理多少G的序列字符数。默认设置下,程序一次处理2G个序列字符,消耗内存12G。
--tmpdir | -t default: directory of --out 设置临时文件夹路径。若将该参数设置为/dev/shm,则会将临时文件存放在内存,会增加内存消耗和计算性能。
--index-chunks | -c default: 4 将seed index分成指定的份数。推荐将该参数值设置成1,能增加计算性能和内存使用量。
DIAMOND默认设置下输出表格格式的结果。结果分12列,其结果信息和BLAST默认设置-outfmt 6输出的格式完全一致。
1. query序列ID
2. subject序列ID
3. Identity百分比
4. 匹配长度
5. 错配长度
6. 打开Gap的次数
7. query序列起始位点
8. query序列结束位点
9. subject序列起始位点
10. subject序列结束位点
11. E-vaule值
12. bitscore得分
参考
http://www.chenlianfu.com/?m=20190407
http://www.chenlianfu.com/?p=2703
https://www.biostars.org/p/382554/