数据库收集生物信息学

查询蛋白结构域

2020-06-04  本文已影响0人  柳叶刀与小鼠标

结构域是蛋白质三级结构的基本结构单位和功能单位

蛋白质三级结构的基本结构单位是结构域。一个蛋白质可以只包含一个结构域也可以由 几个结构域组成,故结构域是能够独立折叠为稳定的三级结构的多肽链的一部分或全部。结构域也是功能单位,通常多结构域蛋白质中不同的结构域是与不同的功能相关联的。许多已知的例子表明,某个种属的多个独立的多肽链完成的几种生物学功能可以由另一个种属的一个蛋白质中的不同结构域来完成。例如,脂肪酸的合成需要七种不同的催化反应,在植物的叶绿体中,这些反应由七种不同的酶所催化,而在哺乳动物中,这些反应则由一条多肽链的七个结构域来完成。

生物体的基因组决定了所有构成该生物体的蛋白质,基因规定了蛋白质的氨基酸序列。蛋白结构域是蛋白中具有特异空间结构和独立功能的区域,是蛋白质发挥生物学效用的关键功能单位。了解蛋白质的空间结构不仅有利于认识蛋白质的功能,也有利于认识蛋白质是如何执行其功能的。确定蛋白质的结构对于生物学研究是非常重要的。

方法(1)Pfam 数据库

Pfam是一个蛋白家族及 功能域的数据库,而不是蛋白质本身的数据库,这个数据库包括蛋白家族的注释 和由隐马尔科夫模型建立的、具有相同注释结果的所有序列的多序列比对结果。Pfam 与其他蛋白相关的数据库的不同之处在于,它以蛋白质的功能域 或者是蛋白家族作为分类检索的标准。 Pfam中的条目可以称为4个种类,除了蛋白 家族和功能域外,还有本定重复序列,以及Motif。 Pfam数据库包括Pfam-A和Pfam-B两个子 库,其中Pfam-A的建立及与其他蛋白数据库中的 经手工注释具有相同分列标签的蛋白序列。Pfam参考的是蛋白数据库在最初的1.0版为 Swiss-Prot数据库,而在13年3月最新发布的27.0 版中,Pfam参考的主要是UniProtKB数据库。 每一个Pfam-A的条目中都保存了符合条件的 所有序列的比对结果,和这个条目的隐马尔科夫模型参数

方法(2)SMAT数据库

SMART (a Simple Modular Architecture Research Tool) allows the identification and annotation of genetically mobile domains and the analysis of domain architectures. More than 500 domain families found in signalling, extracellular and chromatin-associated proteins are detectable. These domains are extensively annotated with respect to phyletic distributions, functional class, tertiary structures and functionally important residues. Each domain found in a non-redundant protein database as well as search parameters and taxonomic information are stored in a relational database system. User interfaces to this database allow searches for proteins containing specific combinations of domains in defined taxa. For all the details, please refer to the publications on SMART.

SMART(http://smart.embl-heidelberg.de/),可以说是蛋白结构预测和功能分析的工具集合。简单点说,就是集合了一些工具,可以预测蛋白的一些二级结构。如跨膜区(Transmembrane segments),复合螺旋区(coiled coil regions),信号肽(Signal peptides),蛋白结构域(domains)等。SMART有两种不同的模式:normalgenomic。两者的区别主要是用的数据库不一样。Normal SMART, 用的数据库 Swiss-Prot, SP-TrEMBL 和 stable Ensembl proteomes。Genomic SMART, 用的是全基因组序列。

上一篇 下一篇

猜你喜欢

热点阅读