生信在线数据库生信工具生物信息学:研一

DAVID&Metascape:专注于基因功能注

2019-03-17  本文已影响3人  765f2ea50d22

本文首发于 ”百味科研芝士“ 微信公众号,转载请注明:百味科研芝士,Focus科研人的百味需求

相信小伙伴们通过我们前文的学习,都知道了如何从GEO数据库获得差异基因,链接:

手把手教你GEO数据库表达谱差异基因分析(上):R版

手把手教你GEO数据库表达谱差异基因分析(下):GEO2R

而差异基因下一步想要进行功能富集分析该如何处理呢?今天的帖子,小编将为大家介绍两个功能富集分析网页版工具——DAVID和Metascape网站,这两个都是专注于基因功能注释和富集通路分析的网站。当然啦,如果你愿意用R去做富集分析,可以参考我们的这一个帖子:

富集分析的R包神器-ClusterProfiler使用

DAVID网站

界面介绍

先看第一个网站——DAVID网站,官方网址为:https://david.ncifcrf.gov/。输入网址后进入网站主页,DAVID网站左侧区域是其四个常用的工具,而常用的是功能注释和ID转换工具。

操作步骤

首先介绍DAVID网站的功能注释工具,点击“Functional Annotation”,在Step1中输入我们准备好的20个差异基因,按照步骤输入。值得注意的是,DAVID网站的基因输入首先不能是单个基因,单个基因富集不到有意义的通路或者功能;DAVID网站的gene list限制输入不超过3000个基因;输入格式是每行一个基因名或者基因名用逗号隔开。

Step2中选择"OFFICIAL_GENE_SYMBOL", Step3中选择"Gene list"。

 点击提交列表,跳转界面。

点击“Gene_Ontology”进行GO分析(基因本体论),也就是对基因进行功能注释,勾选GO分析的三个参数:BP(生物学过程),CC(细胞组分),MF(分子功能)。

点击BP后面的“Chart”。

然后点击“Download File”,下载GO分析BP的数据,跳转页面。

全选后粘贴,保存在一个txt文件里面,用EXCEL打开查看如下。

同样的方法下载GO分析的CC、MF数据,保存在TXT文档里面。

例如本帖选择基因功能富集数量最多五个(数量相等情况下根据P-Value值选择)做条形图,最简单的方法是使用EXCEL来做,准备一个EXCEL表格,将GO号和count数据放在表格里面。

 选中新建的列表,点击插入-图表-条形图-堆积条形图。

点击确定,保存图片,即可得到在文献中很常见的条形图。

GO的分析已完成,接着找到“Pathways”,选择KEGG_PATHWAY

同样点击 Chart。

点击其中一条通路的Term,查看通路图。

点击“Download File”,下载KEGG分析的数据,保存在TXT文档中,EXCEL打开如图。

根据富集基因数量制作一张堆积条形图。

 下拉页面我们可以看到三个选项,点击中间的选项。

可以查看所有的GO和KEGG分析结果。

DAVID常用的第二个功能是基因ID转换,点击“Gene ID Conversion”

例如本帖选择一列基因ID输入step1中。

其余步骤与前述相同。

在Option1中选择“OFFICIAL_GENE_SYMBOL”,点击提交。

跳转界面后,点击框内红色箭头。

最终,基因ID便转换为基因名称了,点击下载保存,基因转换率为100%,当然,当基因ID数量较多时候,可能转换率就达不到100%了。

宝贝评价

DAVID网站还是比较简单的,操作起来也不麻烦,但它的功能却是相当强大的,读过生信文献的小伙伴,应该不少看到DAVID的身影。但是这里吐槽一点~DAVID数据更新稍慢一点,其实也不影响我们的生信分析。

Metascape网站

今天为大家介绍的另一个强大的数据库是Metascape网站,它是如何强大的呢?第一,三步完成基因分析;第二,一次分析即可完成GO、KEGG和PPI;第三,数据更新快,覆盖广,整合了多个数据库的资源。

直奔官网去吧~(http://metascape.org/)。

界面介绍

界面介绍没有太多可说的,因为Metascape官网的界面十分简洁清晰,左侧的数据分析栏,右侧信息公告栏,右上角是网站提供的一些帮助文件和小工具(直接下拉查看吧),页面下拉,有关于Metascape的视频介绍和Metascape引用的一些杂志的信息。

数据分析

傻瓜式的三步~

Step1:输入基因,有两种方式,本地文件导入或者粘贴gene list,右侧我们可以看到Metascape支持xls/xlsx,CSV,txt三种格式。

需要提醒一下,本地输入时候别忘记勾选“Multiple Gene List”选项了哦!

例如粘贴好100个差异基因,点击Submit。

Step2:选择物种,选择H.sapiens人类,可以看到Metascape数据库中还包含了其他物种的信息。

Step3:进行分析,选择“Express Analyze”或“Custom Analyze”都可以。

点击后跳转页面。

结果解读

首先看点击“Express Analyze”后的结果界面,对于分析结果,可以输出在EXCEL表格里面;图片可以显示在PPT模板中;也可以是一个压缩的文件夹。

Figure 1 : 功能富集分析的结果图

 Table 1: TOP20的聚类分析表

Figure 2: 富集网络图,左侧是根据gene ID进行的聚类,右侧是根据P-Value进行的聚类,图片下方有保存的方式。

再看看点击“Custom Analyze”后的结果。

ID Conversion: 这是个gene ID的转换工具,哈哈,又学习了一种GENE ID转换的方法。Metascape支持gene ID、genesymbol的输入,在数据分析过程中,可以自动转换识别。

Annotation: 选择不同的功能注释条目后,点击Apply后进行查看。

Membership: 主要是针对用户自行搜索的一个栏目,比如输入pathway后,点击Search,再点击Apply。

Enrichment: 对于富集分析的参数及cut-off值可以进行更改设置,然后点击“Enrichment Analyze”进行分析,结果和点击“Express Analyze”后的结果是一致的。

宝贝评价

Metascape数据库用起来还是不错的,做基因功能注释丝毫不差于DAVID网站,最主要的是网站更新较快,操作简单。想做功能注释的小伙伴,赶紧行动起来吧!

End

排版:小丸子

往期推文

R统计分析与绘图系列

浅谈一款进阶软件R的实际运用


R语言系列第一期:R语言背景、下载安装及功能介绍

R语言系列第一期(番外篇 ):R的6种对象—向量、矩阵、数组、因子、列表、数据框


R语言系列第二期:①R变量、脚本、作图等模块介绍

R语言绘图之- 画个和弦图给自己


R语言之-画个弦图给自己(二)

富集分析的R包神器-ClusterProfiler使用


GEO数据挖掘系列

手把手教你GEO数据库表达谱差异基因分析(上):R版

手把手教你GEO数据库表达谱差异基因分析(下):GEO2

R语言实例操作分析GEO数据库甲基化芯片

生信神器系列

【神器分享】自从用了这个神器,大规模RNA-seq数据挖掘我也可以

一个逆天的small RNA-seq数据挖掘神器 

免疫组学10KIP-这个数据库好用到爆

懒人如何分析TCGA数据之cBioportal网站


Gephi网络图极简教程


零代码如何画高逼格热图?

GEPIA:点点鼠标分析TCGA数据-超高自由度

单细胞测序(scRNA-seq)通关||数据处理必知必会


             


上一篇下一篇

猜你喜欢

热点阅读