KEGG Brite 数据库

2020-02-10 本文已影响0人生信修炼手册

KEGG被称为京都基因组百科全书，是一个综合性的数据库。对于如此庞大的数据库，肯定需要对数据进行分门别类的整理。除了将各种数据拆分到不同的子数据库中之外，KEGG还对所有的数据进行了更加细致的功能分类，这些功能分类的信息就存储在brite 数据库中。

birte 主要包含以下五大类别的分类信息：

在brite数据库中，以文件的形式存储分类信息。包含两种格式的文件:

image

image

提供了两种格式的文件用于下载，htext 对应的后缀为 keg， json 对应json。

json 格式是网络数据传说的新标准，主要用于程序解析；`keg 文件是纯文本文件，可以用文本编辑器打开。

以所有ko的分类文件 ko00000.keg 文件为例：

image

分类层级按照字母顺序排列，示例文件中A 为第一级分类，B, C, D 依次为第二级。

我们可以直观的看到 K00844 属于Glycolysis / Gluconeogenesis 这个分类，对应的更上一级的分类为Carbohydrate metabolism，再上一级为 Metabolism。

keg 文件格式还是非常容易理解的，但是使用起来不够直观，当我们想要查询某个KO的具体分类时，如果和这个KO处于同一分类的节点太多时，需要往上翻阅很多行，才能找到对应的分类；有时一不小心就翻过了，就会搞错。

当然可以通过程序格式化这个文件，比如将这个文件变成如下的格式：

KO	Name	C	B	A
K00844	HK…	Glycolysis…	Carbo..bolism	Metabolism

这样方便查看条目的详细分类信息；

对于没有编程基础的人来说，kegg 提供了keggHier 程序，专门用于查看brite中的分类信息。软件是用java 开发的，提供了图形界面，简单易用；

下载地址 :

http://www.kegg.jp/kegg/download/kegtools.html

使用方法

双加批处理文件启动

image
从菜单栏点击File按钮，选择导入kegg网站上的数据

image
这里选择第一个kegg pathway map 的分类结构，进行查看

image
向下的三角形表示展开的意思，这里有3个，说明pathway 共有3层分类，鼠标可以点击任意一条记录，可以展开详细信息；
右上角的搜索框可以搜索，通过搜索框可以快速查找你感兴趣的记录

image

总结：