生信学习蛋白结构预测

#分子模拟#同源建模从入门到精通(一)

2017-05-12  本文已影响0人  生信杂谈

不管是药物设计还是分子模拟,蛋白的结构是必须的,结构的好坏直接影响后期实验的可信程度。虽然许多蛋白晶体结构已被解析,但仍有许多结构未被解析,好在聪明的科学家们想出了许多办法进行警惕结构的预测。市面上有许多建模工具,方法各异,有从头建模,同源建模等等。这些方法中常用也同时准确度较高的还是要属同源建模,其主要原理大致为序列相似的蛋白具有相同的结构,同源建模中最有名气的工具要属Swiss-Model以及Modeller。这两款软件/在线服务一直在持续更新,同时引用也较多。
Swiss-Model是巴塞尔大学推出的一款在线同源建模服务器,其使用非常简单方便,只需要将序列粘入,自动化处理结果后邮件通知,下面是其简单的使用方法:



首先点击右上角Create Account进行注册,仅需输入邮箱地址后会收到邮箱和密码,建议使用常用邮箱,因为后期需要接收结果。注册登录后点击Start Modelling进入项目界面。



在左侧Target Sequence输入蛋白信息,其支持Fasta,Clustal,UniProtKB等方式,在右侧导航条上用有SupportedInputs,点击右向下箭头既可以查看Example,如UniProKB信息,一般下方填写项目名称邮箱有Build Model即可自动完成。包括模板选择,建模优化,模型评价等等,非常方便。

若点击Search for Templates则可以自主选择建模的模板,其有覆盖率(Coverage),相似性(Identity),配体(Ligands)和方法(Method)等等信息,其中个人建议根据不同的情况选择不同模板,首先覆盖率与相似性是最需要考虑的,一般情况下越高越好,但若遇到同家族蛋白或二级结构相似蛋白也可以进行一定的调整,若做药物筛选或分子对接的情况下建议选择有Ligands的模板,Ligands结构相似的模板更将。结构解析方法X-ray情况要好于NMR,分辨率越低说明结构越清晰,这样建模出来质量更佳。同时可以查看所选序列相似位置以及序列模板的比对情况。一般情况下同样相似度的均匀相似性要比集中相似性模板构建情况要好。最后建模结果如下界面。

其模型评价主要有两种方法,一种是比较出名许多同学都不太会解读的QMEAN评价:
QMEAN是一种全局和局部模型质量的符合评分函数,其由四种结构描述所构成:超多三个连续氨基酸的转角势能对局部几何分析,两对距离势能来评价全原子和C-beta之间来的联系,溶剂化能描述残基状态。这些评分被拿来与已知高分辨率的晶体结构来进行比较,从而得出结构的准确性。
QMEAN值的范围为0到1,值越高结果越好,若界面上有个大拇指,表示结果很佳。
GMQE是一种整体的质量估计,其评价参数来源于建模的模板参数,同样得到的分数位于0到1之间。GMQE得分也会参考一定的QMEAN值,分数越高表示结果越可靠。
当然Swiss-Modeller建模方式简单,可操控性低,对于模型相似度较高的蛋白可以使用这种方法,若模型质量较低,可以采用更加强大的Modeller,这款神器我们下期详细讲解,记得关注哦!

上一篇下一篇

猜你喜欢

热点阅读