基因功能注释
2020-06-09 本文已影响0人
毕金鹏biofarmer
1.InterPro注释
InterPro数据库简介
Interpro是EBI开发的一个整合的蛋白家族功能注释数据库,包括Gene3D、CDD、Pfam等10几个数据库,官网链接。
这里主要介绍下linux 下运行InterProScan5来进行基因功能和注释,软件说明。User documentation 有详细的教程。软件的安装主要分两步进行:
- 1 下载地址 ftp://ftp.ebi.ac.uk/pub/software/unix/iprscan/5/ ,根据你的linux版本和发布日期来选择最适版本,软件很大最近版大约9.1G。建议下载完成后用 md5 -c 进行check再解压安装。
- 2 构建本地PANHTER(Protein ANalysis THrough Evolutionary Relationships) 数据库,该数据库是 Gene Ontology Phylogenetic Annotation Project 的一部分。需要下载并解压到软件安装目录下的 /path of interproscan/data/ ,下载地址 ,根据需要选择需要下载的版本。同样建议下载完成后用 md5 -c 进行check再解压。软件本身自带了很多数据库,不需要安装,有CDD,COILS,Gene3D,HAMAP,MobiDBLite,PANTHER,Pfam,PIRSF,PRINTS,ProDom,PROSITEPATTERNS,PROSITEPROFILES,SFLD,SMART,SUPERFAMILY,TIGRFAM。
-
3 软件的运行依赖java11 python3,可以再自己的环境变量里面添加,也可以修改软件的配置文件interproscan.properties。运行 interproscan.sh 测试是否成功安装,弹出help界面就是成功安装啦。
11.png