生信基础知识关于测序的背景与实验生物信息

KEGG是什么:快速了解KEGG

2019-08-09  本文已影响85人  Amy_Cui

我们有时候很关心基因所在的pathway、上下调控以及一堆基因富集到的pathway,再或者同源基因等信息,KEGG数据库也算是目前(注释)常用的明星数据库

KEGG:京都基因和基因组百科全书

KEGG现有数据库.png KEGG功能.png

KEGG数据库目前统计的数据

https://www.kegg.jp/kegg/docs/statistics.html,能看到有536条pathway。406个module。

KEGG当前统计.png

KEGG Orthology 数据库

KEGG建立了KEGG直系同源系统(the KEGG Orthology(KO) system) ,该系统吧分析网络的相关信息连接到基因组在中,从而发展和促进了跨物种注释流程。因此在KEGG 数据库中,直接存储分子功能的就是KEGG Orthology 数据库

KEGG的pathway

根据相关知识手绘的,这里的手绘的意思可能是指人工以特定的语言格式来确定通路各组件的联系。
基因组信息主要是从NCBI等数据库中得到的,除了有完整的基因序列外,还有没完成的草图。

ko编号就是一个pathway,例如ko04722,这个通路不分物种,相当于所有物种这一通路的并集

K编号表示一个基因,例如K02582,是ko通路中的基本单元,某一K编号代表的不是某一具体物种的基因,而是所有物种的某一同源基因的统称。

pathway,module 等数据库都是建立在KO数据库的基础上的,KO可以说是KEGG中处于核心地位的一个数据库,所以理解KO数据库就特别的重要。

对于一个具体的KO来说,在这个KO下是一系列基因,这些基因可以来源于不同的物种,但是具有相同的功能。以K00161为例,对应的同源基因的列表可以从KEGG的官网查询得到。

pathway的五种类型:

仅仅第一种参考通路是手动画出来的,其他的通路图都是通过计算产生的。pathway中的每一个框或线都对应一个或多个K编号、EC编号及R编号。

KEGG主页可以搜索的类型如:


参考资料:https://wenku.baidu.com/view/7017b2ce09a1284ac850ad02de80d4d8d15a0198.html?rec_flag=default&sxts=1565257075866

上一篇 下一篇

猜你喜欢

热点阅读