GEO&TCGA数据库挖掘

手把手教你用R语言下载TCGA数据库:RTCGA

2019-05-09  本文已影响1人  765f2ea50d22

本文首发于 ”百味科研芝士“ 微信公众号,转载请注明:百味科研芝士,Focus科研人的百味需求

点击蓝字关注我们

各位科研芝士的朋友,大家好,今天我们继续在TCGA R包的海洋里遨游,作为TCGA下载专业户,我们继续分享tcga好用的工具包,今天的主角是RTCGA。RTCGA这个包工作流程如下:

该包实际上一系列根据数据类型分离的包,相当于要先下载这些离线数据R包之后再直接从离线数据包里面获取TCGA的所有数据。具体网址:

https://rtcga.github.io/RTCGA/index.html

下面开启你的R界面,学习该包:

1. 首先安装,因为我们是需要下载RNAseq数据,所以我们还需要安装RTCGA.mRNA包,同样借助BiocManager安装,前提也是你要安装好BiocManager,命令如下:

2. 加载该包:

OK,可以看到没有任何问题,这也表明,我们安装并成功加载该工具包。

3. 查看所包含的数据,用info()命令:

结果如下:

4.这里以肺癌为例,提取芯片的表达数据,用expressionTCGA函数进行提取:

结果如下:

5. 对感兴趣基因提取相应的表达量。

结果如下:

6. 这里同样以肺癌为例,提取RNAseq的表达数据,用expressionTCGA函数进行提取:

结果如下:

7. 对感兴趣基因提取相应的RNAseq表达量,注意提取感兴趣的基因需要输入格式为:Gene Symbol|Entrz ID

结果如下:

获得了这个矩阵,就表示你的数据下载成功了!

OK,今天的教程主要是带大家体验TCGA基于R语言的第六种数据下载方式,下期我们继续推出TCGA的第七种编程方式下载,今天的数据下载先讲到这,下期再见。

                         关注微信公众号:“百味科研芝士”,后台回复"RTCGA",获取R包

上一篇下一篇

猜你喜欢

热点阅读