windows本地BLAST(二):操作及应用
以blastn用法为例:
1、建索引:
makeblastdb -dbtype nucl -in ref.fasta
注:
-dbtype:序列类型,nucl为核酸序列,prot为蛋白序列。
-in:输入文件,fasta格式文件。
2、比对:
blastn -query query.fa -db ref.fasta -outfmt 6 -out query_result.blastn
注:
-query:你要查询的输入序列,fasta格式文件。
-db:比对用的数据库,跟上一步是一样的基因组序列文件。
-outfmt format: 输出文件格式。
0 = Pairwise,
1 = Query-anchored showing identities,
2 = Query-anchored no identities,
3 = Flat query-anchored showing identities,
4 = Flat query-anchored no identities,
5 是 BLAST XML类型的输出文件,
6是tab格式的输出文件,
7是带注释行的tab格式的输出文件,
8 = Seqalign (Text ASN.1),
9 = Seqalign (Binary ASN.1),
10 = Comma-separated values,
11 = BLAST archive (ASN.1),
12 = Seqalign (JSON),
13 = Multiple-file BLAST JSON,
14 = Multiple-file BLAST XML2,
15 = Single-file BLAST JSON,
16 = Single-file BLAST XML2,
17 = Sequence Alignment/Map (SAM),
18 = Organism Report
我选的是6,输出的blastn文件有12列:
第一列:Query_id
第二列:Subject_id
第三列:%_identity
第四列:alignment_length
第五列:mismatches
第六列:gap_openings
第七列:q.start
第八列:q.end
第九列:s.start
第十列:s.end
第十一列:e-value
第十二列:bit_score