科研信息学

两条命令就可以计算出两条序列的相似性

2019-09-29  本文已影响0人  gtt儿_生物信息学习

微信公众号:生物信息学习

在科研过程中经常会想要知道两条序列的相似性,在线版的工具blast很好用,但如果我有非常多个数据,不想用在线版的做,那本地版的blast也是很好用的。
下载安装是很简单的,那我们就看看它的使用吧。我想要比较两条序列的相似性,就把其中一条序列作为参考序列,另一条序列和它比较。
1.首先makeblastdb

makeblastdb -in test.fa -dbtype prot -out test_db.fa ##我的序列是蛋白序列,所以dbtype选的是prot

2.开始计算(我的参考序列和计算的序列都是蛋白序列,因此用blastp)

blastp -query  a.fa -max_target_seqs 10 -db test_db.fa  -outfmt 6 -out  test.out

最终结果就在test.out中展示
结果如下所示:

test    test    100.00  15      0       0       1       15      1       15      2e-09   31.6

其中结果是没有header的,那每一列对应的header是什么呢?如下所示:

query_ID        subject_ID      simility        length  mismatch        empty   query_start     query_end       subject_start   subject_end     evalue  bit_score

在线版的链接:
https://blast.ncbi.nlm.nih.gov/Blast.cgi
windows版的详细介绍:
https://www.ncbi.nlm.nih.gov/books/NBK52637/

微信公众号:生物信息学习

上一篇下一篇

猜你喜欢

热点阅读