生信

Blast,Blast+,Diamond比较

2019-02-21  本文已影响0人  生物信息与育种

1. Blast

-m 比对结果格式选项:

1 = query-anchored showing identities,查询-比上区域,显示一致性
2 = query-anchored no identities,查询-比上区域,不显示一致性
3 = flat query-anchored, show identities,查询-比上区域的屏文形式,显示一致性
4 = flat query-anchored, no identities,查询-比上区域的屏文形式,不显示一致性
5 = query-anchored no identities and blunt ends,查询-比上区域,不显示一致性,无突然的结束
6 = flat query-anchored, no identities and blunt ends,查询-比上区域的屏文形式,不显示一致性
7 = XML Blast output,XML格式的输出
8 = tabular,TAB格式的输出
9 =tabular with comment lines,带注释行的TAB格式的输出
10 =ASN, text,文本方式的ASN格式输出
11 =ASN, binary [Integer] default = 0,二进制方式的ASN格式输出

m8格式12列结果:

Query id, Subject id, % identity, alignment length, mismatches, gap openings, q.start, q.end, s.start, s.end, e-value, bit score
第一列为Query(递交序列),
第二列为数据库序列(目标序列subejct),
第三列为: identity
第四列为:比对长度
第五列为:错配数
第六列为:gap数
第七列和第八列为:Query开始碱基位置和结束碱基位置
第九列和第十列为:Subject开始碱基位置和结束碱基位置
第十一列为:期望值
第十二列为:比对得分

Ref: https://blog.csdn.net/g_r_c/article/details/8477924https://blog.csdn.net/bangemantou/article/details/7726585

2. Blast+

blast+是blast的升级,将blastn,blastx等程序与blastall命令分隔开来,对各个命令的参数定制更为方便。
blast+也是格式化数据库和比对搜索两步,但命令不同。

3. diamond

diamond主要4个程序:makedb/blastp/blastx/view
也是建库和 比对两步。
-(1)建库
diamond makedb --in nr.fa -d nr
参数说明
--in : 参考序列(格式:fasta)
-d: 索引的前缀名

-(2)比对
diamond blastp -db nr -q reads.fa -e 1e-5 -f 6 -o out_diamond.m6 -k 10 -p 2
主要参数说明
--db/-d <file> 输入比对数据库
--query/-q <file> 比对序列
--threads/-p 线程数
--out/-o <file> 输出文件
--outfmt/-f 输出文件格式,默认6(表格)
--evalue/-e 比对的最大evalue值(默认0.001)
--max-target-seqs/-k 比对到的最大序列数,默认值是25

其他参数
--top 百分数的形式表示--max-target-seqs
--min-score 最小评分
--id 给出指定百分比的数据
--subject-cover 最小覆盖度
--unal (0,1) 是否输出未比对上的reads(0=no, 1=yes)
--sensitive 建议对齐较长的序列
--more-sensitive 比对准确度更高
--block-size/b,一次处理的十亿碱基的大小,主要控制内存使用,默认为2(预计使用此内存数量的大约六倍,即默认内存使用将到达12G),转录流程使用0.2
--salltitles 将全长标题包含在DAA格式中,默认DAA文件仅包含缩短序列ID(直到第一个空白字符)

转录组流程使用参数
/ifs4/BC_PUB/biosoft/pipeline/RNA/RNA_RNAdenovo/RNA_RNAdenovo_2016a/Annotation/../software/diamond blastx --evalue 1e-05 --threads 3 --outfmt 5 -d /ifs4/BC_PUB/biosoft/db/Pub/nr/RNA/20170924/animal.fa -q allcdnawithnovelcds.fa -o allcdnawithnovelcds.fa.blast.nr --seg no --max-target-seqs 5 --more-sensitive -b 0.2 --salltitles

PS: 流程中diamond已建好库,如nr:/ifs4/BC_PUB/biosoft/db/Pub/nr/RNA/20170924
Ref: https://github.com/bbuchfink/diamond/blob/master/diamond_manual.pdf

diamond输出格式:

0 BLAST pairwise format.  
5 BLAST XML format.  
6 表格模式 (默认输出格式).    
100 DIAMOND  
101 SAM format.  
102 Taxonomic classification.  
103 PAF format.
上一篇 下一篇

猜你喜欢

热点阅读