BioinformaticsGEO SRA ArrayExpress ENA 数据挖掘生信分析工具包

scanGEO:整合多个GEO数据集

2018-03-02  本文已影响135人  生信family

之前我写了shinyGEO,今天再给大家介绍一下ScanGEO。
照惯例,先给出文章:

ScanGEO: parallel mining of high-throughput gene expression data

背景

以往分析GEO的工具都只能同时分析一个研究(study)或一个基因,比如我之前讲过的shinyGEO一次只能分析一个study。但现实情况显然没有这么简单,有时候我们还需要分析与特定基因集相关的多个研究。因此,scanGEO应运而生。

网页版:http://scangeo.dartmouth.edu/ScanGEO/
R语言版:https://github.com/StantonLabDartmouth/AppScanGEO

示例

image.png
  1. 这里,我物种选择人类,搜索关键词选择『lung cancer』,共搜索到26个研究。此时『Significant Genes』和『Significant Studies』是没有信息的。

    image.png
  2. 点击『KEGG Pathway』,选择『Cell Cycle』,选择选择与细胞循环通路相关的信息,如下图

然后点击『Scan』,选择显著性水平,最后点击『ScanGEO』,等待数分钟


image.png
  1. 查看结果
    点击『Significant Genes』,可以看到Cell Cycle通路中的某个基因在人类肺癌相关数据集中显著的次数。
    image.png

点击『Significant Studies』,如下图所示。


image.png

总结

R语言版本的我就不写了,网页版也挺好用的,就是网速不能太慢~~
另外,你也可以直接搜索某些基因,就是点击『Custom Genes』,然后输入感兴趣的基因或基因集。

欢迎大家关注我的微信公众号『生信family』

qrcode_for_gh_a055c85e7513_258-2.jpg
上一篇下一篇

猜你喜欢

热点阅读