常用的生物信息学数据库(核酸,蛋白)
2019-05-04 本文已影响25人
吴涛_631b
数据库
1、PubMed数据库
检索技巧
- AU:作者
- TI:标题
- AB:摘要
- AD:地址
示例:dUTPase [TIAB] Beijing [AD]
2、GenBank核酸序列数据库
一级核酸数据库包括:GenBank(NCBI)、ENA(EMBL)、DDBJ(NIJ)
3、基因组数据库Ensemble
4、微生物宏基因组数据库JCVI
5、二级核酸数据库
-
RefSeq数据库:非冗余数据库,有基因组序列,蛋白序列,和转录序列
-
EST数据库:表达序列标签数据库
-
Gene数据库
-
ncRNA数据库
-
microRNA数据库
6、一级蛋白质序列数据库(UniProt数据库)
-
Swiss-Prot 人工注释
-
TrEMBL 计算机翻译除去Swiss-Prot中的序列
-
PIR 蛋白质信息资源数据库
-
UniProt数据库有三层:UniParc(所有序列)、UniRef(去除重复序列)、UniProtKB(Swiss-Prot、TrEMBL)
7、一级蛋白质结构数据库
PDB数据库
8、二级蛋白质数据库
-
Pfam:根据序列来推知未知功能的蛋白质上有哪些已知的结构域
-
CATH:Class、Architecture、Topology、Homologous superfamily 以结构域分类,包括PDB的蛋白质和公共数据库的蛋白质序列做出的预测
-
SCOP2 主要关注进化关系,依赖于人工验证