生信基础知识

多序列比对——用ESPript 3.0做出漂亮的序列比对图(1

2023-05-08  本文已影响0人  Serotonin要努力

       ESPript3.0网址:https://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi

       氨基酸序列的多重序列比对是重要的生物信息学分析方法,常用的工具软件有MEGA, DNAMAN, ClustalX等,但并不能生成高质量、美观的图片。ESPript 3.0可以全面、高质量地展示多重序列比对结果,并且可以同时展示序列的二级结构,突出序列的细节和重点,分析序列的亲疏水性和相对可溶性等。

       ESPript 3.0网页界面显示出三种模式(MODE),自左至由分别为初级 BEG (BEGinner),进阶级 ADV (ADVanced)和专业级 EXP (EXPert)。使用者可根据自身需求选择不同的模式作图。根据不同的使用需求,下面将分别介绍其基本功能和进阶功能。

      本次介绍初级功能BEG (BEGinner)

前期准备:

       首先,使用Clustal X或MEGA做氨基酸序列的多序列比对并将结果保存为.aln或.fasta格式。

       随后,预测目的蛋白的三维结构,为了尽量全的展示序列结构,建议使用ITASSAR预测。

      下面以人类、小鼠和斑马鱼的sod1多序列比对为例讲解。

1.     用MEGA做多重序列比对并保存.fas格式,将多重序列比对结果拖入或添加入Aligned Sequences, 同时勾选Number sequences.

如果只是需要一个多重序列比对的结果,此后的步骤就可以接看步骤3及以后步骤。此时所得到的结果如下

2.   从PBD库中下载小鼠SOD1蛋白三维结构3GTT.pdb,并将pdb文件拖入Secondary structure depiction; 若三维结构为多聚体,在Chai ID处写出需要展示的氨基酸链,此处选择为A链。

注:软件默认二级结构展示出的为多重序列比对中的第一个序列,如二者不对应,则需要进一步自定义序列顺序。

而本例子中第一个序列为SOD1_human,与提供的小鼠SOD1三维结构模型不对应,因此需要在Sequences to display处自定义序列顺序。

3.   选择序列相似性描述参数

通常默认即可

4.     定义序列顺序

        如不需要自定义顺序,则默认参数即可(all)。

        此处将序列的顺序改为:2 1 3

5.     序列比对输出定义

序列输出调整可以自行尝试

6.     选择输出图片格式

可以选择不同的格式与分辨率。等待生成后保存即可。

输出结果:

上一篇 下一篇

猜你喜欢

热点阅读