R语言分析单细胞分析

自测小样本应该如何设计实验?

2020-02-24  本文已影响0人  概普生信

不知大家被疫情封印在家的这些日子里是在潜心科研,还是天天吃吃睡睡吃吃?今天呢,小编就来跟大家分享一篇2020年1月10号发表在frontiers in Oncology杂志上的一篇文章。这篇文章是自测的数据,数据并不多,相关的临床信息也不多,但是其组织选择的很考究,这对于大家有想自测数据的,可以作为一个参考。作者通过对结直肠癌基质和上皮组织的基因表达谱进行整合分析,应用加权基因共表达网络算法,识别出了四个高度连接的基因模块,并使用NTP(nearest template prediction)算法将结直肠癌分成了三个亚型。

Identification of Distinct Immune Subtypes in Colorectal Cancer Based on the Stromal Compartment

基于基质组织识别结直肠癌的不同免疫亚型

数据和方法

样本数据

在手术中采集了6名结直肠癌患者的癌症以及癌旁组织的样本, 然后通过显微解剖人工地将肿瘤和正常样本的基质组织区分, 并提取了它们的RNA(原始以及处理后的表达谱存储在GEO数据库: GSE136735);该研究还使用了GSE39582数据集(已知的有完整临床信息的最大结直肠癌数据集)和TCGA-COADREAD数据(做了log2转换);此外,为了比较研究识别出的亚型之间的相似性以及对ICB(免疫检查点阻断剂)疗法的应答,作者还用了四个ICB预处理的肿瘤表达谱:anti-PD-1治疗的黑色素瘤患者(GSE78220)、MAGE-A3免疫治疗的转移性黑色素瘤患者(GSE35640)、anti-CTLA-4治疗的小鼠AB1-HA肿瘤(GSE63557)和从IMvigor210下载的anti-PD-L1治疗的转移性尿路上皮肿瘤数据。

识别结直肠的代表性模块

为了比较结直肠癌和正常组织间上皮以及基质的生物学不同,作者利用WGCNA识别了不同区室的代表性转录网络模块。在删除了动态性较差的基因后,标准差较高的前8000个基因被用来构建共表达网络。

基于微环境特征识别结直肠癌亚型

作者通过NTP算法将患者分为三种免疫亚型,NTP使用预定义的基因标记进行类预测,并返回每个样本预测的显著性p值,阈值为0.2。

子类映射

基于GSEA(基因集富集分析)的SubMap方法被用来评估识别出的亚型和免疫治疗患者之间的相似性,p值越低,相似性越高,R包complexHeatmap用来将结果可视化。

亚型间突变和拷贝数异常的关联

通过MutSigCV_1.41获得了TCGA-COADREAD数据集的显著突变基因,每个患者的肿瘤突变负荷(TMB)定义为每兆基的非同义突变总数,并采用Fisher’s精确检验来检测活性免疫与活性基质间的不同突变基因。对于拷贝数分析,作者利用GISTIC_2.0识别显著扩增或缺失的基因组,其突变负荷定义为点和臂水平上具有拷贝数变化的基因总数。

其他生物学分析

对于WGCNA得到的四个关键转录模块,作者运用R包clusterProfiler进行了GO功能分析,GSEA被用来富集从Molecular Signatures数据库下载的hallmark基因集,显著性p值为0.05;通过对结直肠癌患者使用微环境细胞种群计数(MCP-counter)方法,分析了结直肠癌免疫和基质细胞的浸润模式;此外,作者向Cmap网站提交了300个FC值最显著(上调和下调个150)且在TCGA-COADREAD中FDR<0.5的基因,以进一步阐释活性免疫和活性基质之间存在免疫原性差异的分子机制,并识别潜在的有效药;R包pRRophetic被用来评估TCGA-COADREAD和GSE39582群体对5-氟尿嘧啶和顺铂的化疗反应;最后,作者采用Wilcoxon秩和检验比较两组之间的差异,使用Kruskal-Wallis来检验两组以上的差异,R包edgeR采用“用来进行差分表达分析,用Kaplan-Meier方法估计生存概率,运用Mantel-Cox检验比较两组间的生存分布,所有的统计分析都是基于R语言完成的。

结果

结直肠癌和癌旁组织上皮及基质的转录图谱

研究通过对前面提及到的8000个基因的WGCNA分析,识别出了12个转录模块(图1.A),基因数从47到1874不等。在将每个模块的特征基因与区室性状进行关联时,识别出了四个分别与肿瘤上皮(蓝色模块)、肿瘤基质(黄色模块)、正常上皮(红色模块)和正常基质(棕色模块)相关性最显著的模块(图1.B)。同其余三组中的样本相比,这些模块在各自最密切相关的样本中的特征值最高(图1.C),图1.D显示了所有模块的表达水平,这四个模块在它们最相关的样本中具有非常高的表达水平。图1.E是这四个模块各自的部分GO富集结果,其中,正常基质和肿瘤基质之间不同的GO生物学过程包括免疫浸润细胞的转化,红色模块则富集到了代谢相关的通路。对结直肠癌和癌旁正常组织的基质与上皮区室的系统分析表明,肿瘤基质可能会为肿瘤细胞的增殖和侵袭提供一个合适的环境。

图1. 识别代表不同结直肠癌区室的模块

基于微环境识别结直肠转录亚型

基于肿瘤环境,研究将结直肠癌患者分为不同的亚型,以做进一步分析。并分别将黄色模块和棕色模块(分别对应肿瘤基质和正常基质)中网络度最高的前20个基因作为基因模板,在两个模块中,基因模板与整个模块的基因都是高度相关的(图2.A),作者基于这些基因模板利用NTP算法将TCGA-COADREAD中的样本分成了活性基质、活性免疫和混合型三种亚型(图2.B)。hallmark基因集的GSEA分析结果表明,活性基质亚型与血管生成、EMT和肌生成有关(图2.C),活性免疫亚型中的基因富集到了干扰素α反应、γ反应与同种异体移植排斥反应等免疫激活相关的生物学过程(图2.D)。在TCGA-COADREAD和GSE39582群体中,活性免疫亚型的无复发生存率要比其他两种亚型高(图2.E-F),但并没有观察到总体存活率的显著差异。总的来说,活性免疫亚型对肿瘤的发生发展具有良好的免疫条件,而活性基质亚型则相反。

在TCGA-COADREAD中,不同亚型间的性别、诊断年龄和BMI分布并无显著差异。在活性免疫亚型中,MSI-H和MSI-L(微卫星高/低不稳定性)以及CMS1(CMS1-4为结直肠癌的四种共识分子亚型)、CMS3、早期肿瘤(I期和II期)占主导地位,而微卫星稳定性亚型、CMS4和晚期肿瘤(IV期)在活性基质亚型中占主导地位。

 图2. 识别的基因模板揭示了具有不同免疫背景的亚型

基于TME的亚型与免疫治疗反应有关

免疫治疗可持久缓解转移性黑色素瘤和非小细胞肺癌,但只有一小部分患者能够获得临床反应。因此,在实施治疗之前检测对免疫治疗敏感性高的患者是至关重要的,为了全面描绘已识别亚型的免疫图谱,作者对已发表的功能基因集进行了免疫背景的注释。活性免疫亚型富集了T细胞、细胞毒性淋巴细胞、高表达的免疫检查点(PD-1, PD-L1, CTLA-4)和一些活性免疫反应因子,活性基质亚型则富集了内皮细胞、成纤维细胞、EMT和转化生长因子特征基因(图3.A)。

SubMap分析表明,活性基质亚型与黑色素瘤患者的抗PD-1耐药性以及PD-L1检查点抑制剂治疗的转移性尿路上皮肿瘤具有很高的相似性;活性免疫亚型与对MAGE-A3治疗有反应的黑色素瘤患者和对CTLA-4治疗有反应的BALB/c小鼠具有很高的相似性(图3.B)。不同的免疫治疗方案与已识别的免疫亚型并未表现出一致性,这可能是由于在不同的方案和癌症中癌细胞的反应机制不同所致,对GSE39582数据集的SubMap分析也获得了相似的结果。此外,在之前的POPLAR试验中建立的8个生物标记物的表达(除GZMB外)在活性免疫组明显高于活性基质组(图3.C)。通过对GSE39582的分析,研究得到了类似的结果,而且已识别的亚型之间肿瘤纯度也没有观察到显著差异。

 图3. 识别具有不同背景和治疗反应的免疫亚型

基于TME的亚型的基因组特征

就TMB而言,活性免疫组和混合型组患者的水平高于活性基质组,活性免疫组与混合型组却无显著差异。而且与活性免疫组相比,混合型组也没有表现出特殊的免疫特性或免疫治疗效果(图3.B),这表明该研究的免疫亚型分类可以在相似的TMB背景下识别出炎症患者。为了系统地阐述基因组机制,研究重点分析了通过MutSigCV_1.41识别(q < 0.05)的43个显著突变的基因(SMGs),并识别出了活性基质和活性免疫组间14个不同的突变基因(P < 0.05),如图4.B所示。活性免疫组的突变基因参与抗原呈递、细胞周期调控、信号通路和外源性凋亡通路等过程;而活性基质组中,抑癌基因(包括TP53和APC)更常发生突变。这些数据表明,肿瘤细胞可能适应不同的逃逸机制,主要是通过损害活性免疫组的外源性凋亡通路和抗原呈递,以及排斥活性基质组的免疫效应细胞。

接下来,研究探讨了不同免疫组之间的拷贝数变化,与以往报告的结果相似,与活性基质组相比,活性免疫组患者在点和臂水平上的扩增与缺失负荷较低。图4.D展示了这些亚型中所有染色体的G-score分布。在活性基质组中检测到了染色体点扩增(13q34、20p11.21和20q13.33)和缺失(4q32.1、5q15和5q34)突变,如图4.E。在结肠癌中,体细胞拷贝数变异(SCNA)水平与细胞毒性免疫浸润的减少有关,而总突变数的增加与高免疫浸润有关。混合型组的拷贝数增益和缺失负荷介于活性免疫组和活性基质组之间(图4.C),这表明局部拷贝数的改变可能导致了结直肠癌免疫浸润的差异。

 图4. 不同免疫亚型的遗传和拷贝数变异

基于TME的亚型的化疗反应趋势和活性基质亚型NF-kB通路的激活

考虑到化疗是结直肠癌治疗中应用最广泛的策略,作者利用pRRophetic包来预测患者对5-氟尿嘧啶和顺铂的治疗反应。在TCGA-COADREAD中,活性免疫亚型对5-氟尿嘧啶更敏感,活性基质亚型对顺铂更敏感(图5.A);在GSE39582群体中,化疗敏感性和基于TME的亚型之间也有很强的一致性。

为了挖掘靶向活性基质的候选药物和小分子,作者使用了CMap工具,CMap是一种连接基因、药物和疾病的数据驱动算法,被广泛用于发现潜在的治疗药物和小分子,并探索这些药物的作用机制。研究挖掘出了22个绝对连接得分>90的候选小分子(图5.B),作者发现同活性免疫亚型相比,TRAF7的下游基因MMP9和IL6在活性基质亚型中过表达(图5.C),TRAF7是肿瘤坏死因子受体超家族成员的信号转导器,这表明了活性基质中NF-kB通路的激活。因此,使NF-kB通路失活的策略,如阻断TRAF7,可能有助于细胞毒性T细胞的浸润和杀死结直肠癌细胞。

 图5. 免疫亚型间不同的化疗敏感性

好了,今天的文章小编就为大家解读到这里了。大家一定要做好疫情的防控工作吆,相信在我们的共同努力下,情况会尽快得到控制的。

上一篇下一篇

猜你喜欢

热点阅读