临床生物信息学代谢组学菜鸟日记NGS

ClueGO:用Cytoscape做富集分析的插件

2019-03-02  本文已影响0人  生信义博

富集分析是了解一个基因集功能倾向性的一个方式,在组学研究领域应用广泛。常见的有基于差异基因的Over-representation分析,也就是常说的GO、KEGG富集分析和Functional class scoring分析,如GSEA。这两种富集分析算法不同,但可以都支持同样的注释集,如GO、KEGG或其他类型的注释。基本原则只有一个:基因集的基因名字与注释集的基因名字能匹配。剩下的就是了解下原理去操作了。

今天给大家介绍的是Cytoscape的插件——ClueGO。ClueGO能以网络图的形式来展示GO富集结果。

除了在线工具和R代码,今天带来的是网络绘制工具Cytoscape的一个插件ClueGO,支持200多个物种,支持数据库实时更新,支持多个注释数据集,支持多集合富集结果比较和网络图展示。配合Cytoscape的网络操作,可以做更多探索。下面看看怎么安装和使用吧。

ClueGO安装

官网下载

http://apps.cytoscape.org/apps/cluego

image

Cytoscape的APP Manager中下载

image
image

ClueGO激活

ClueGO第一次使用需要按照提示申请license,申请网址为:http://www.ici.upmc.fr/cluego/cluegoLicense.shtml。 点击Request a license key,填写基本信息之后提交审核,审核时间可能需要几天。拿到license之后点击App-ClueGO,在弹出的提示框中输入license即可激活ClueGO。

简单使用ClueGO

1. 上传数据

可以粘贴基因的idsymbol等或从本地上传文件 (富集分析的基因集只需要基因名字),我们以ClueGO的示例文件“CluePediaExampleFile_Th1RelatedGenes.txt”为例,并选择其对应物种和自动识别Gene id类型选项。

image

2.选择富集数据集和富集标准

默认是BP(Biological Process),我们增加常用的CC(ellular component)和MF(Molecular Function)

image
然后勾选以下选项,目的是只显示p值<=0.05的富集结果。具体选择的富集显著性Pvalue,可自行调整。
image

3.富集分析和结果展示

点击start开始进行富集分析

image
运行结束后,会跳出一个简述富集结果信息的提示框,包括物种, 基因名字匹配的注释信息重叠度冗余度等信息。
image
Cytoscape的网络视图中展示的是富集结果的网络图。每个节点代表性富集通路节点的连线表示通路之间的共有的基因数颜色表示该节点的富集情况分类(隶属于哪个功能组,颜色也可以和表格形式的的ClueGO结果对应)。
image

结果导出为矢量图

image

结果保存为表格或Excel格式

image

ClueGO优势

1. 物种丰富,并支持手动下载

本地有人类和小鼠可选,也可根据需要下载,支持近200个物种。

image

2. 物种注释手动更新

image
(前面推荐的GOEAST是每周更新,这个可以认为是实时更新。R中的注释包相比来说更新的慢了些,需要社区发布新版本或自己整理。)

3. 多种网络布局和自由网络设计

多种网络布局类型选择

image
style选项可对网络的颜色,节点,网络等进行修改
image

4. 多个数据集比较

同时导入2组或多组基因列表,可以进行比较分析。

image
富集结果
首先跳出了一个简述富集结果信息的提示框,和单组分析类似,包括物种, 基因名字匹配的注释信息重叠度冗余度等信息,但是额外统计了了两组共有的基因的富集结果。
image
Cytoscape的网络视图中展示的是富集结果的网络图。每个节点代表性富集通路节点的连线表示通路之间的共有的基因数颜色表示该节点的富集情况分类,而两组单独的,综合的,共有的富集通路等均可在ClueGO results详细看到。
image
image

5. 链接外源数据库

看到感兴趣的基因、通路,可以直接选择需要的外源数据库查询获得更多信息。

image
上一篇下一篇

猜你喜欢

热点阅读