两条命令就可以计算出两条序列的相似性
2019-09-29 本文已影响0人
gtt儿_生物信息学习
微信公众号:生物信息学习
在科研过程中经常会想要知道两条序列的相似性,在线版的工具blast很好用,但如果我有非常多个数据,不想用在线版的做,那本地版的blast也是很好用的。
下载安装是很简单的,那我们就看看它的使用吧。我想要比较两条序列的相似性,就把其中一条序列作为参考序列,另一条序列和它比较。
1.首先makeblastdb
makeblastdb -in test.fa -dbtype prot -out test_db.fa ##我的序列是蛋白序列,所以dbtype选的是prot
2.开始计算(我的参考序列和计算的序列都是蛋白序列,因此用blastp)
blastp -query a.fa -max_target_seqs 10 -db test_db.fa -outfmt 6 -out test.out
最终结果就在test.out中展示
结果如下所示:
test test 100.00 15 0 0 1 15 1 15 2e-09 31.6
其中结果是没有header的,那每一列对应的header是什么呢?如下所示:
query_ID subject_ID simility length mismatch empty query_start query_end subject_start subject_end evalue bit_score
在线版的链接:
https://blast.ncbi.nlm.nih.gov/Blast.cgi
windows版的详细介绍:
https://www.ncbi.nlm.nih.gov/books/NBK52637/