DAVID在线功能富集介绍
我们通过GEO或者其他数据库筛选出了一批显著差异基因,接下来就需要分析这些基因参与了哪些功能,我们下一步需要进行GO功能注释和KEGG(pathway)通路富集分析。那么,啥叫GO功能注释呢?以及什么叫KEGG(pathway)通路富集分析,我们所做的GO和KEGG是为了从这批差异基因中得知他们参与的功能与通路。
先说说GO,GO(GENG ONTOLOGY)分别从功能、参与的生物途径、细胞中的定位,对基因产物进行了简单注释。所以通过GO富集分析可粗略的了解基因富集在哪些生物学功能、途径或细胞定位。
再说说KEGG,大多数听说KEGG(Kyoto encyclopedia of genes and genomes)的人都会把它当做一个基因通路(pathway)的数据库,其实它的功能还不止于此。KEGG是一个整合了基因组、化学和系统功能信息的综合数据库。
DAVID (the Database for Annotation,Visualization and Integrated Discovery)的网址是http://david.abcc.ncifcrf.gov/。 DAVID是一个生物信息数据库,也是一款在线免费分析软件,其整合了生物学数据和分析工具,为大规模的基因或蛋白列表(成百上千个基因ID或者蛋白ID列表)提供系统综合的生物功能注释信息,帮助用户从中提取生物学信息。目前DAVID数据库主要用于差异基因的功能和通路富集分析,对很多科研工作者来说,是个非常好的工具。
准备输入文件
需要一列类似的含有基因名数据

开始进入分析

选择functioal annotation选项

(1)粘贴基因(2)选择official—gene-symbol(3)选择genelist(4)提交list

提交完成后,界面会弹出上面所示的提示框 ,按确定即可。

按照如上流程进行,1 list1——2 Use——3选择物种“homo sapines(人类)”——4 点击Select Species

首先把所有默认选项都清空,只选择Gene_Ontology下的GOTERM_BP_DIRECT和CC、MP和Pathways 下的KEGG_PATHWAY ,最后点击 Functional Annotation chart,结果就出来了。

可以点击右上角的Download File 按钮,将结果进行复制保存。其中结果包括功能和通路两部分。
Kobas数据库
简介
KOBAS(KEGG Orthology Based Annotation System)是一个被广泛用于基因/蛋白质功能注释和功能集富集的网页版数据库。使用者在给定一组基因或蛋白质,该数据库可以确定某些通路和基因本体论(GO)是否有统计学显着性。
KOBAS 3.0的输入不支持gene symbol,所以使用者在使用前需将Symbol ID转换成Entrez Gene ID(或者)ensembl格式的ID。
推荐进行基因ID转换的网站:gprofiler :http://biit.cs.ut.ee/gprofiler/gconvert.cgi

使用者需要(1)上传或者粘贴含有基因列表的数据(2)选择物种为homo sapines(人类)(3)确定输出格式为ENSG(4)点击RUN(5)下载注释后的数据:Export to CSV。下载的注释后的数据如下所示:

KOBAS注释
使用者将转换后的ID输入http://kobas.cbi.pku.edu.cn/anno_iden.php,根据研究对象类型,进行相应选择:选择KEGG Pathway与GO,点击Run;

将富集结果下载:

下载得到富集结果如下:

GO与KEGG富集分析,DAVID和KOBAS是比较简单同时受欢迎和认可的选择。
相比之下,KOBAS画出的图更赏心悦目,但KOBAS不支持直接输入gene symbol,所以我们常常联合DAVID和KOBAS联合使用。
作者:柳叶刀与小鼠标
链接:https://www.jianshu.com/p/344b9a1eb9b9
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。