富集分析DAVID、Metascape、Enrichr、Clue
前言
一般我们挑出一堆感兴趣的基因想临时看看它们的功能,需要做个富集分析。虽然公司买了最新版的数据库,如KEGG,但在集群跑下来嫌麻烦。这时网页在线或者本地化工具派上用场了。
DAVID
DAVID地址
以前我会首选DAVID,原因是方便简单。有人说它数据库更新慢,不准确(据说被science点名批评了),也有人说它运行慢,数据库更新慢是硬伤,但我只是大概看下基因集的功能,总体结果不会差到哪里去。至于运行速度我反而觉得比其他工具更快。
使用方法:
![](https://img.haomeiwen.com/i7698829/e44d6afdc96de722.png)
![](https://img.haomeiwen.com/i7698829/dfa16b153b0958e8.png)
注释结果有很多,挑自己感兴趣的数据库,我一般看GO和KEGG。
![](https://img.haomeiwen.com/i7698829/0c53455d1f09a5fd.png)
校正下超几何检验的Pvalue值,查看结果,结果都有链接,很方便查看。
![](https://img.haomeiwen.com/i7698829/0f58a3451ff19d7e.png)
![](https://img.haomeiwen.com/i7698829/af0342db80d3577a.png)
但是DAVID没有可视化结果,临时看一看还行。
Metascape
Meatascape地址
Metascape是Cytoscape的一个插件,其数据更新快,覆盖面广泛。整合了GO、KEGG、UniProt和DrugBank等多个权威的数据库,使其不仅能完成通路富集和生物过程注释,还能做基因相关的蛋白质网络分析和涉及到的药物分析。
![](https://img.haomeiwen.com/i7698829/3f790566fae19a84.png)
默认分析Express Analysis
![](https://img.haomeiwen.com/i7698829/4ed73691721c6240.png)
针对小白,直接生成一个简单明了的报告,图文并茂,结果包括富集总括、基因列表、基因注释、富集分析、蛋白互作富集等。并且可以下载excel表,ppt和zip压缩文件。
![](https://img.haomeiwen.com/i7698829/c95c74e5b4736d84.png)
![](https://img.haomeiwen.com/i7698829/99da2b8554c7f91f.png)
![](https://img.haomeiwen.com/i7698829/c53d6e5bacd5ab69.png)
网络图还可保存为CYS格式,后续放到cytoscape中进行编辑。
![](https://img.haomeiwen.com/i7698829/be86f1167006ee62.png)
定制分析CustomAnalysis
Annotation可以根据自己的需要,选择感兴趣的,想在结果中体现的基因注释查看与基因注释 相关的文章")项目来进行勾选。勾选完成之后,点击左上角的Apply按钮运行。
![](https://img.haomeiwen.com/i7698829/a7423e868bb5fe39.png)
Membership支持用户自行选择通路富集、生物过程富集、功能相关和产物分析等每一个注释步骤所用到的数据集,并可以在搜索框中输入感兴趣的字段,比如GO中的某一个或某几个term,或者一些功能性的描述,以便进行更有针对性地分析。
输入完成感兴趣的字段之后,点击左侧的Search按钮进行查找,之后点击左上方Apply生成这一步骤的结果。
![](https://img.haomeiwen.com/i7698829/615e9bf070060342.png)
Enrichment支持用户选择通路和功能富集过程中的各项指标,以及蛋白质互作网络形成过程中的各项指标。用户可以根据自己的需求,来设定显著性阈值,网络中包含元素的最大或最小值,以及分析步骤中想用到的数据集等参数。
![](https://img.haomeiwen.com/i7698829/71e248c693fddd60.png)
生成报告
![](https://img.haomeiwen.com/i7698829/e674d4b3138031f3.png)
报告形式同上。
![](https://img.haomeiwen.com/i7698829/b1c135e487f93271.png)
Enrichr
Enrichr地址
除了支持gene list,还支持bed文件,但支持的gene ID种类比较少。
![](https://img.haomeiwen.com/i7698829/0ef0c1e3d9d0b261.png)
Enrichr结果将多个数据库进行比较。除了常用的富集分析,还可展示表观修饰、转录因子结合以及疾病和不同细胞类型中的表达。
![](https://img.haomeiwen.com/i7698829/893224e8cab5e42e.png)
但是它展示结果比较单一,各个数据库结果差异也较大,个人不是很喜欢。
ClueGO
ClueGO也是Cytoscape的插件,在cytoscape中本地化安装使用,除了做功能富集外,主要是具有强大的绘图功能,目前被很多文章引用。
![](https://img.haomeiwen.com/i7698829/0cb78136a4af762a.png)
以上工具中,DAVID和Metascape甚至clusterProfiler等R包的结果我都只作为参考,真正做分析的时候还是需要用最新的数据库。当然,Metascape和ClueGO可作为后期绘图补充。