TCGAbiolinks
2023-02-27 本文已影响0人
byejya
环境:
image.png
版本:
image.png
library(TCGAbiolinks)
> projects <- TCGAbiolinks::getGDCprojects()$project_id
> projects <- projects[grepl('^TCGA', projects, perl=TRUE)]
> projects
image.png
测试一个下载,发现直接就有按照层次命名好的目录
query <- GDCquery(project = "TCGA-OV",
data.category = "Transcriptome Profiling",
data.type = "Gene Expression Quantification",
workflow.type = "STAR - Counts")#GDC在2022.3.28更新了,workflow.type只能选择STAR - Counts
GDCdownload(query)
image.png
只支持star
image.png
尝试全部下载到默认位置并使用默认命名
image.png
image.png
有多种类型数据
image.png
命名也很全
image.png
临床数据
image.png
直接下载的表达数据中就包含临床数据
image.png
看重合
表达
image.png
临床
image.png
image.png
image.png
做生存分析时的参数选择:
vital_status
OS.time: 当患者dead时,days_to_death为OS.time;当患者alive时,days_to_last_follow_up为OS.time