scanGEO:整合多个GEO数据集
2018-03-02 本文已影响135人
生信family
之前我写了shinyGEO,今天再给大家介绍一下ScanGEO。
照惯例,先给出文章:
ScanGEO: parallel mining of high-throughput gene expression data
背景
以往分析GEO的工具都只能同时分析一个研究(study)或一个基因,比如我之前讲过的shinyGEO一次只能分析一个study。但现实情况显然没有这么简单,有时候我们还需要分析与特定基因集相关的多个研究。因此,scanGEO应运而生。
网页版:http://scangeo.dartmouth.edu/ScanGEO/
R语言版:https://github.com/StantonLabDartmouth/AppScanGEO
示例
image.png-
这里,我物种选择人类,搜索关键词选择『lung cancer』,共搜索到26个研究。此时『Significant Genes』和『Significant Studies』是没有信息的。
image.png
-
点击『KEGG Pathway』,选择『Cell Cycle』,选择选择与细胞循环通路相关的信息,如下图
然后点击『Scan』,选择显著性水平,最后点击『ScanGEO』,等待数分钟
image.png
- 查看结果
点击『Significant Genes』,可以看到Cell Cycle通路中的某个基因在人类肺癌相关数据集中显著的次数。
image.png
点击『Significant Studies』,如下图所示。
image.png
总结
R语言版本的我就不写了,网页版也挺好用的,就是网速不能太慢~~
另外,你也可以直接搜索某些基因,就是点击『Custom Genes』,然后输入感兴趣的基因或基因集。
欢迎大家关注我的微信公众号『生信family』
qrcode_for_gh_a055c85e7513_258-2.jpg