生信在线数据库转录组数据分析

IMex和IntAct数据库简介

2018-11-23  本文已影响5人  生信修炼手册

欢迎关注”生信修炼手册”!

蛋白质相互作用的数据库非常的多,比如DIP, MINT, IntAct, BioGRID等,不同数据库中的信息存在了大量的冗余,而且在不同数据库之间进行检索也非常的费力。

为了减少不同数据库的冗余,最大化提升数据存储和检索的效率,由多个数据库的开发团队和维护者共同参与成立了一个委员会,名字叫做international molecular exchange consortium, 简称IMEx, 该委员会致力于将不同数据库中的信息合并,减少冗余并提供了一个统一的查询工具

该委员会的成员示意如下


该项目的地址如下

http://www.imexconsortium.org/

通过官网的检索框,可以方便的检索各个成员数据库中的内容,示意如下

tp53为例,检索结果如下


点击IMEx的链接,可以看到如下所示的表格

采用了MITAB格式来展示蛋白质相互作用信息,通过左上角的Download按钮可以进行下载,通过IMEx的官网,我们可以方便的查询某个蛋白的相关作用网络信息的,但是下载数据并不是非常的方便,如果要下载数据,还是要借助IntAct数据库。

IntAct数据库是IMEx的成员数据库之一,目前该数据也整合了IMEx的所有数据,网址如下

https://www.ebi.ac.uk/intact/

在线检索功能肯定是有的,如下所示,支持多种查询方式

在检索结果的页面,可以自定义展示的列信息,也可以选择对应的格式进行下载,示意如下

通过Graph按钮,还可以显示查询蛋白的相互作用网络

和string数据库相比,IntAct的检索功能也有其局限性,只适用于查询单个蛋白的相互作用网络,无法查询输入的多个蛋白之间的相互作用网络。如果要查询多个蛋白之间的相互作用网络,只能自己写脚本从整个相互作用网络中提取信息,官网提供了下载功能,示意如下

提供了多种格式的下载,主要有XMLTAB两种格式, PSI-MI格式就是xml格式的文件,PSI-MI TAB就是\t分隔的文件,TAB格式的内容相对直观,而XML格式适用于程序处理。

对于蛋白质相互作用网络而言,String数据库的使用更加简单,更加的人性化,所以知名度更高,而IMEx和IntAct的使用有一定的技术门槛,但是可以作为String数据库的一种补充,能够得到更加丰富的信息。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

上一篇下一篇

猜你喜欢

热点阅读