在Windows系统中搭建本地Blast序列比对环境
2019-01-28 本文已影响0人
伽罗CG4825
在实验室中,我们经常需要对分子生物学数据进行分析,常见的有DNA和蛋白质分子序列比对。分子序列比对分为全局序列比对和局部序列比对两种情况。其具体算法我们将在以后的文章中详细介绍。局部序列比对即我们常用的NCBI上的Blast工具。在生物信息数据分析中,也经常要进行Blast比对,从而进行序列注释。然而,利用网页序列比对不能做到批量比对和大量数据比对,因此需要本地化序列比对,在本地计算机进行比对计算。
本文讲解如何在Windows系统中搭建本地Blast序列比对环境。
-
下载与安装Blast
1.1 Blast软件包下载地址:
ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ncbi-blast-2.9.0+-win64.exe
1.2 安装软件包
双击安装程序,选择“I agree”
选择安装目录(我自己喜欢默认安装到D盘)
运行结束后,打开命令行,输入blastp -h
即可看到帮助命令
注释:若不能出现帮助命令,可手动在系统变量里面添加Blast目录地址,从而添加blast程序到系统变量。
- 构建本地数据库
安装Blast软件包后,系统命令即可启动blastn等命令,但是blastn等命令需要数据库作为比对目标,因此需要构建本地数据库。
注释:真正的数据分析时,需要从NCBI下载NR数据库,然后构建本地数据库。
2.1 下载数据库或自备数据库序列文件
2.2 格式化数据库
2.2.0 makeblastdb 帮助信息
2.2.1 构建格式化数据库
构建成功后会出现多个文件
- 序列比对
3.1 准备分析序列文件
序列文件需为fasta格式:
>sequence name
AGCTGCGATGACGTAG
例如
3.2 将序列文件放置到工作目录下
D:\db\test_Protein
3.3 运行blast程序
3.4 运行程序后就可在目录下得到比对结果文件
文件内容