GEO&TCGA数据库挖掘生信分析流程生信在线数据库

零代码下载TCGA数据库第二期:UCSC-XENA工具

2019-04-10  本文已影响2人  765f2ea50d22

本文首发于 ”百味科研芝士“ 微信公众号,转载请注明:百味科研芝士,Focus科研人的百味需求

点击蓝字关注我们

各位科研芝士的朋友,大家好,今天我们继续分享关于TCGA数据下载的专题,第一节我们介绍了基于TCGA官网下载RNAseq数据。这次我们给大家推荐一个无编程的网页版工具,帮助我们轻松下载TCGA数据。今天,我们的主教就是UCSC-XENA工具。

或许你早已听过他的大名,或许你初入TCGA的江湖,初闻该名,不过一切都不算晚,今天我们就轻轻的点击鼠标,实现我们的数据下载梦。

01

UCSC-XENA网址

https://xena.ucsc.edu/

人家的界面长这样:

黄色框框是官网给的如何使用该网址的教程。

红色框框是我们需要点击进入的界面。

02

点击launch Xena,出现下面的界面,那数据藏在哪里了呢?

03

 点击DATA Sets 进入数据存储站,出现下面的界面

可以看到在右侧的Active Data Hubs 包括了很多,不仅涵盖了TCGA还包括ICGA,Pan-Cancer Atlas Hub等数据节点。因为我们是研究TCGA,我们只需要选中TCGA就可以了。

04

选中TCGA,进入TCGA数据站,其包含的数据主要是下面38个

05

随便选择一个癌症,比如选择第一个AML,点击进去,出现下面的界面

我们发现该网站已经整理好了各类数据,包括CNV,DNA甲基化等,方便用户下载,大大方便了我们使用。接着我们找到RNAseq数据,如下,注意有两个点,一个是exon expression RNAseq,一个是gene expression RNAseq,我们选择gene expression RNAseq,点击带有*号的数据,进入。

06

点击之后,进入下面的界面:

点击红色框内的链接便可以进行数据下载了,下载之后的数据是一个压缩包,解压之后便可以使用了。

07

数据说明

大家可以看到,他的单位是log2(count+1),说明这个网站是对count数进行了这种方式的处理来归一化的,不是FPKM哦,这个地方需要和大家说一下哈。

Ok,今天的教程主要是带大家体验TCGA的第二种数据下载方式,下期我们继续推出TCGA的第三种方式下载,今天的数据下载先讲到这,下期再见。

关注公众号,后台回复“生信资源”,获取200G生信资源包

End

上一篇下一篇

猜你喜欢

热点阅读