用clustalX和ESPrint对未知三维结构蛋白序列比对
未知三维结构蛋白的多重序列比对分析:
1、多重序列比对:
将需要比对的文件以FASTA格式保存在同一个文档中,建议扩展名保存为fas格式(txt也可以),最好保存在桌面(或者保存在英文目录的文件夹,不然有汉字的文件夹clustalX2.1会报错)
clustalX2.1-File-Load sequence file打开文档
然后进行多重比对Alignment-Do complete alignment:
最后保存为aln格式,以便后期使用:
- 三维蛋白结构下载:
本例中这个蛋白的空间结构未知,在没有已知蛋白结构文件的情况,可以将目的序列提交到蛋白质二级结构预测网站分析,推荐使用Zhang Lab 的I-TASSER server 服务器:http://zhanglab.ccmb.med.umich.edu/I-TASSER/.
请注意:先要注册才能使用。
https://zhanglab.ccmb.med.umich.edu/I-TASSER/registration.html
用自己想要比对的蛋白序列进行同源蛋白建模:
最后的比对结果如下:
下载top1中的pbd文件格式,也就是建模好的氨基酸三维结构文件,用于后期的序列分析:
对于三维结构已知的蛋白,可以在PDB数据库下载参考序列的PDB文件,打开PDB网站(https://www.rcsb.org/)
切换到“Sequence”标签(https://www.rcsb.org/pages/search_features#search_sequences),粘贴入参考序列的序列,点击搜索图标。
搜索结果中会显示参考序列的结构文件,点击对应的图标,下载PDB文件。
3.提交ESPript3.0 着色美化:
http://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi
分别将.aln文件和下载的蛋白结构文件.pdb 文件一起上传对应:
设置其中的参数:
是否在每行前显示氨基酸数量:
是否显示序列一致性与相似性:
字体大小,每行放多少氨基酸以及行距(自己可以设置)
导出文件格式设置:
最后点击网站左上方的“Submit”按钮即可。(浏览器左下角会显示上传进度)
结果自动弹出:
点击PDF文件预览:(唯美的结果就展现在面前~)
没自动弹出文件的原因可能是浏览的弹出窗口阻止了结果窗口的弹出,可以在”工具“-”弹出窗口阻止程序“-”关闭弹出窗口阻止程序“。也可以将ESPript网站设置为允许弹出的网站。
如有不妥之处请各位大神指出来,相互学习!
转载自基迪奥生物