GDCRNATools的安装与使用---TCGA数据下载与分析工
2020-02-16 本文已影响0人
养猪场小老板
- GDCRNATools是一个R软件包,用于下载,组织和综合分析GDC中的lncRNA,mRNA和miRNA数据
介绍
- The Genomic Data Commons (GDC,基因组数据库) 保存有美国国家癌症研究所(NCI)计划的标准化基因组,临床和生物样本数据,包括癌症基因组图谱(TCGA)和产生有效治疗的治疗性应用研究(TARGET),它也接受高质量的数据集和来自非NCI支持的癌症研究计划,例如来自Foundation Medicine的基因组数据。
- GDCRNATools是一个R软件包,它提供了一个标准,易于使用和理解的方法,用于下载,组织和综合分析GDC门户中的RNA表达数据,重点在于解密与癌症相关的lncRNA-mRNA相关ceRNA调控网络。
- 可以使用GDCRNATools进行许多分析,包括差异基因表达分析(limma(Ritchie等人2015),edgeR(Robinson,McCarthy和Smyth 2010)和DESeq2(Love,Huber和Anders 2014)),单变量生存分析。 (CoxPH和KM),竞争性内源RNA网络分析(超几何测试,Pearson相关分析,调节相似性分析,灵敏度Pearson部分相关)和功能富集分析(GO,KEGG,DO)。 除了一些常规的可视化方法(例如火山图,散点图和气泡图等)外,GDCRNATools还开发了三个简单的闪亮应用程序,使用户可以在本地网页上可视化结果。
- 这个用户友好的程序包使研究人员可以通过简单地运行一些功能并整合其流水线来执行分析,例如分子亚型分类,加权相关网络分析(WGCNA)(Langfelder和Horvath 2008)以及TF-miRNA协同调控网络分析 等轻松地导入工作流程。
安装
- GDCRNATools现在可以在Bioconductor中查到。虽然安装 GDCRNATools有各种方式,但是我们只介绍R代码安装。
#先安装BiocManager,之后就可以安装其它包了
#但是对于R 3.5 以下的版本,依旧需要使用BiocLite
if (!requireNamespace("BiocManager", quietly = TRUE))
install.packages("BiocManager")
BiocManager::install( )
###大量安装 ###
BiocManager::install(c('limma', 'edgeR', 'DESeq2', 'clusterProfiler', 'DOSE', 'org.Hs.eg.db', 'biomaRt', 'BiocParallel'))
install.packages(c('shiny', 'jsonlite', 'rjson', 'survival', 'survminer', 'ggplot2', 'gplots', 'Hmisc'))
### 单个安装 ###
BiocManager::install('limma')
BiocManager::install('edgeR')
BiocManager::install('DESeq2')
BiocManager::install('clusterProfiler')
BiocManager::install('DOSE')
BiocManager::install('org.Hs.eg.db')
BiocManager::install('biomaRt')
BiocManager::install('BiocParallel')
install.packages('shiny')
install.packages('jsonlite')
install.packages('rjson')
install.packages('survival')
install.packages('survminer')
install.packages('ggplot2')
install.packages('gplots')
install.packages('Hmisc')
-
操作手册
1、下载
提供了两种方法来下载Gene Expression Quantification (HTSeq-Counts),Isoform Expression Quantification 亚型表达定量(BCGSC miRNA分析)和Clinical (Clinical Supplement) data:
- 手动下载
第一步: 在 GDC网站上下载 GDC Data Transfer Tool
第二步: 将数据加载到 GDC cart, 下载 cart中的manifest file 和 metadata
第三步: 通过manifest file,用gdcRNADownload()
函数下载 - 自动下载
通过在gdcRNADownload()
函数中指定RNAseq 和 miRNAs data数据的project.id
和data.type
自动下载GDC Data Transfer Tool, manifest file, 和 data ; 然后 通过gdcClinicalDownload()
函数下载临床数据。 - 另外,用户还可以使用 TCGAbiolinks(Colaprico et al. 2016)中开发的API方法或TCGA-Assembler(Zhu, Qiu, and Ji 2014)方法从GDC下载数据。
1.1 下载说明
-
a)安装GDC Data Transfer Tool gdc-client
从 GDC 网站下载 GDC Data Transfer Tool 然后解压缩该文件
-
b)从 GDC Data Portal下载 manifest file 和 metadata
-
c)下载RNAseq / miRNAs/ Clinical data
####### 下载 RNAseq 数据 #######
gdcRNADownload(manifest = 'TCGA-PRAD/TCGA-PRAD.RNAseq.gdc_manifest.2017-11-23T14-40-52.txt',
directory = 'TCGA-PRAD/RNAseq')
####### 下载 miRNAs 数据 #######
gdcRNADownload(manifest = 'TCGA-PRAD/TCGA-PRAD.miRNAs.gdc_manifest.2017-11-22T15-36-57.txt',
directory = 'TCGA-PRAD/miRNAs')
####### 下载 Clinical 数据 #######
gdcRNADownload(manifest = 'TCGA-PRAD/TCGA-PRAD.Clinical.gdc_manifest.2017-11-23T14-42-01.txt',
directory = 'TCGA-PRAD/Clinical')