手把手教你用R语言下载TCGA数据库:RTCGA
本文首发于 ”百味科研芝士“ 微信公众号,转载请注明:百味科研芝士,Focus科研人的百味需求
点击蓝字关注我们
各位科研芝士的朋友,大家好,今天我们继续在TCGA R包的海洋里遨游,作为TCGA下载专业户,我们继续分享tcga好用的工具包,今天的主角是RTCGA。RTCGA这个包工作流程如下:
该包实际上一系列根据数据类型分离的包,相当于要先下载这些离线数据R包之后再直接从离线数据包里面获取TCGA的所有数据。具体网址:
https://rtcga.github.io/RTCGA/index.html
下面开启你的R界面,学习该包:
1. 首先安装,因为我们是需要下载RNAseq数据,所以我们还需要安装RTCGA.mRNA包,同样借助BiocManager安装,前提也是你要安装好BiocManager,命令如下:
2. 加载该包:
OK,可以看到没有任何问题,这也表明,我们安装并成功加载该工具包。
3. 查看所包含的数据,用info()命令:
结果如下:
4.这里以肺癌为例,提取芯片的表达数据,用expressionTCGA函数进行提取:
结果如下:
5. 对感兴趣基因提取相应的表达量。
结果如下:
6. 这里同样以肺癌为例,提取RNAseq的表达数据,用expressionTCGA函数进行提取:
结果如下:
7. 对感兴趣基因提取相应的RNAseq表达量,注意提取感兴趣的基因需要输入格式为:Gene Symbol|Entrz ID
结果如下:
获得了这个矩阵,就表示你的数据下载成功了!
OK,今天的教程主要是带大家体验TCGA基于R语言的第六种数据下载方式,下期我们继续推出TCGA的第七种编程方式下载,今天的数据下载先讲到这,下期再见。
关注微信公众号:“百味科研芝士”,后台回复"RTCGA",获取R包