序列比对

生信常用数据库(三):SwissProt和TrEMBL数据库搭建

2020-10-22  本文已影响0人  geneonto

前言

    UniProt是信息最丰富、资源最广的蛋白质数据库,由两大部分组成,SwissProt和TrEMBL,SwissProt为高质量的、手工注释的、非冗余的数据集,TrEMBL包含未校验的、自动注释的条目,这两数据库在基因组注释中会常用到,尤其是高质量的SwissProt数据库。

下载

    选择Swiss-Prot和TrEMBL的fasta文件下载即可

下载链接: Download

安装

    Swiss-Prot和TrEMBL数据库解压后用blast建立索引即可使用(blast软件添加环境变量)

gunzip uniprot_sprot.fasta.gz    #解压

makeblastdb -in uniprot_sprot.fasta -dbtype prot  #建索引

gunzip uniprot_trembl.fasta.gz   #解压

makeblastdb -in uniprot_trembl.fasta -dbtype prot  #建索引

    建完索引后可以直接用blast软件进行比对

上一篇下一篇

猜你喜欢

热点阅读