estimate数据挖掘
看到文章 Aging (Albany NY). 2018 标题是:Mining TCGA database for genes of prognostic value in glioblastoma microenvironment
安排给了生信菜鸟团学徒进行数据分析图表复现,大家可以去菜鸟团公众号搜索到全部代码。
-
TP53突变型和TP53野生型BRCA病人的差异分析结果 https://mp.weixin.qq.com/s/Phu-MxA0d079HdtBWTHbWg
-
耐药患者组织与敏感的患者组织内的成纤维细胞比较 https://mp.weixin.qq.com/s/b4gTPB2Da5x7F8fr9MawkQ
-
TCGA数据库中三阴性乳腺癌在亚洲人群中的差异表达 https://mp.weixin.qq.com/s/IOGfzzpcWkzyQPzMADKY4g
-
有PIK3CA基因突变的肿瘤病人的转录水平变化 https://mp.weixin.qq.com/s/MJLEZPWqzJe4LaKRDtiZQQ
-
下载乳腺癌的芯片表达数据进行差异分析 https://mp.weixin.qq.com/s/CJb27qhbjdZadJDnK2vNLw
-
GEO数据挖掘-第六期-RNA-seq数据也照挖不误 https://mp.weixin.qq.com/s/eRzhXX2CTkXRifnR31KT4Q
-
GEO数据挖掘-第五期-肝细胞癌(HCC)-多组分开差异分析 https://mp.weixin.qq.com/s/w4yKK8nb10pLxwAF94ybfA
-
保姆式GEO数据挖掘演示--重现9分文章 https://mp.weixin.qq.com/s/PDG9-0-0BoesQbahj1ezmA
-
GEO数据挖掘-第四期-肝细胞癌(HCC) https://mp.weixin.qq.com/s/J_RcdFeQqWFErZobPPrKVw
-
GEO数据挖掘-第三期-口腔鳞状细胞癌(OSCC) https://mp.weixin.qq.com/s/n2k04i_AB9VyDZQeAlacTg
-
GEO数据挖掘-第二期-三阴性乳腺癌(TNBC) https://mp.weixin.qq.com/s/sBghqry6NpzjdgzQlYrFnQ
-
GEO数据挖掘-第一期-胶质母细胞瘤(GBM) https://mp.weixin.qq.com/s/5Bdx7YyAk8InYs2MFIUUVQ
第二期目录如下:
- 热图、韦恩图、GO富集分析图
- 纯R代码实现ssGSEA算法评估肿瘤免疫浸润程度
- 按基因在染色体上的顺序画差异甲基化热图
- 有生物学意义的复杂热图
- 干扰MYC-WWP1通路重新激活PTEN的抑癌活性——3步搞定GSEA分析
- TCGA正常血液样本中PD-L1与BRCA1和NBS1的表达量相关性
背景知识
- ESTIMATE (Estimation of STromal and Immune cells in MAlignant Tumor tissues using Expression data)
- extracellular matrix (ECM)
- World Health Organization (WHO)
- Glioblastoma multiforme (GBM)
- Chinese Glioma Genome Atlas (CGGA) database.
- overall survival (OS)
- Affymetrix microarray data of all 417 GBM cases obtained in TCGA database
- 对芯片数据使用limma包找差异基因,阈值是Fold change > 1.5 and adj. p < 0.05 were set as the cut-offs to screen for differentially expressed genes (DEGs).
WHO把GBM分成3压型:
- (1) IDH-wildtype,
- (2) IDH-mutant, and
- (3) NOS (not otherwise specified)
数据分析步骤
- 下载TCGA数据
- 计算样本免疫微环境评分
- 免疫微环境评分与各个临床特征(WHO分组及OS生存)的关系
- 免疫微环境评分高低样本的基因表达差异
- 这些差异基因与预后的关系,筛选预后显著相关的差异基因
- 外部数据集 (CGGA) 验证这些基因