TCGA数据分析肿瘤免疫微环境生信精读文献

文献阅读——clinical cancer research(1

2019-04-07  本文已影响12人  陈宇乔

Tamborero D, et al., A Pan-cancer Landscape of Interactions between Solid Tumors and Infiltrating Immune Cell Populations. Clin Cancer Res 2018.


文章标题

文章方法学

step1

对9174个样本包括了29种癌肿,对16种肿瘤浸润的免疫细胞+cytotoxic cells进行了分析。

step2 对比评价多种TILs的分析方法

2.1计算主要分为两种方法:基因富集法vs去卷积分法(cibersort)
两种方法
前三种是基因富集法vs后两种去卷积分法 两种方法的优劣

总结来:去卷积分法方法固定,不够灵活,最终只是几个相对百分比值。而基因富集法更加灵活,可以私人订制自己研究,最后是给出一个免疫细胞评分.
此外,他认为cibersort不适合用于RNA-seq的数据,而适合用在microarray的数据上。他还使用了一种方法将RNA-seq的数据转化为microarray的方法。但最终的数据显示cibersort这种去卷积分法的效果没有基因富集法来的优秀。
所以,文章最终选取了基因富集法。

2.2 基因富集法有三种,作者综合了各种计算方法的优劣,选择了将两种方法学进行了综合运用。

这16种细胞的gene expression signature是来自于两种算法的综合

gene expression signature来源
这里作者使用了GSVA对免疫细胞进行评分
方法一 方法二 方法三
中度正相关 高度相关和高度负相关,作者觉得不好直接放弃 高度正相关

所以最终作者使用的immune cell gene expression signature中绝大多数是使用了方法一,少部分方法三,没有方法二。

Step3 采用免疫细胞GSVA score作者对样本进行了聚类分析,最终将肿瘤免疫表型分为了6类。

Figure1

Step4 免疫分型和临床相关性的研究(理解Figure1D中的火山图)

第一:作者做了每个癌肿的关于免疫分型于临床相关性指标的linear regression。
比如LUAD(肺腺癌):将x设定为每个肿瘤样本的分期stage,y设定为每个样本的immunophenotype。就可以计算每一个相关系数。也就是图figure1D中的effect size


linear regression

第二:q vaule的计算方法


q value
第三: 每个癌肿的effect size 和q vaule就可以画出下面的火山图。
火山图
Figure2 A-D都是上述的火山图

描述了immunophetype 和其他指标之间的关系

Step5 Driver genes 和immunophetype的关系

driver gene的定义
Driver genes 和immunophetype的关系

使用logistic regression计算出每个癌肿的driver gene于immunophotype的相关性(Y=1-6的免疫表型,X=某个基因如tp53是否有突变(0,1))
气泡图中气泡的有无代表了是否相关,气泡的颜色代表了于哪个免疫类型相关(1-6型)。气泡大小代表了相关相关系数magnitude

Step6 功能聚类,对不同的immunophetype进行GSVA功能聚类分析

Figure3

Figure3C 表示的是每个癌种不同的immunophetype(不同的颜色)是否在相应的通路上有富集。
类如最左下角的蓝色表示,在2型immunophetype上的 LUSC在TGFβ信号通路上富集
Figure3B是figure3C的横向叠加,大小表示这条通路上富集的癌种的数目
Figure3A是富集的基因占整个pathway的比例。

Step7 三个免疫浸润的模型于基因组和转录组学之间的关系(其实也就是immunophetype的另外一种体现:1-2代表poorly cytotoxic infiltrate;3-4代表suppression infiltrate;5-6代表cytotoxic infiltrate)

Figure4
上一篇 下一篇

猜你喜欢

热点阅读