缺氧思路发不了高分?这两篇十分的文章告诉你缺氧可以这么做!
今天的文章解析比较特殊,小编为大家选择了两篇缺氧相关的文章。
这两篇文章是同一个课题组先后发布的,今天主要来介绍发表于今年三月份的高分文章。这篇文章是建立在另一篇文章的基础上,更全面细致的对I期肺腺癌患者的临床结果和治疗反应进行了预测。
Identification and validation of hypoxia-derived gene signatures to predict clinical outcomes and therapeutic responses in stage I lung adenocarcinoma patients
鉴定和验证缺氧衍生基因标志,以预测I期肺腺癌患者的临床结果和治疗反应
发表期刊:Theranostics
发表日期:2021 Mar 5
影响因子:预计达到10分+
DOI: 10.7150/thno.56202
一、研究背景
肺腺癌(LUAD)已成为非小细胞肺癌(NSCLC)最常见的亚型,是全球癌症死亡的主要原因。不幸的是,即使是I期肺癌,其预后也很差,手术切除后5年总生存率约为70%。近年来,越来越多的研究提出了NSCLC患者的风险分层和生存预测的基因组标志。
缺氧环境是氧需求和供应不平衡的结果,腔内缺氧是癌症的一个关键标志,它与恶性进展,治疗阻力和预后不良广泛相关。
二、材料与方法
1 数据来源
1)训练集:GSE72094;验证集1:GSE68465,GSE14814,GSE31547(未发表),Chitale的队列;验证集2:GSE30219,GSE31210,GSE50081,GSE37745,GSE29013,E-MTAB-923(均为微阵列)
2)三个独立的验证集:TCGA(RNA-seq)、GSE41271和GSE13213(微阵列)
3)从GSE63557获得了20只BALB/c小鼠皮下接种AB1-HA细胞接受抗CTLA-4治疗的转录组数据和治疗反应
4)体性突变和拷贝数变异(CNV)资料来自TCGA
5)CCLE:69个LUAD细胞系的TPM值
6)LUAD样本片段的微阵列数据(GSE30979)
7)GSE69405获取了77个细胞的单细胞RNA-Seq数据:来自一个没有任何治疗的LUAD患者
8)从MSigDB中检索到的转录组剖面数据和相应的基因集(癌症相关标志如 "细胞周期进展(CCP)"、"上皮-间质转化(EMT) "和 "缺氧 "等模块)
9)HIF1A在LUAD中的潜在目标是从Cistrome Cancer获得的
2 分析流程
计算每个样本的缺氧相关预后风险评分(HPRS)和缺氧相关免疫治疗反应评分(HIRS),如下所示:
三、结果展示
01 - 缺氧被确定为I期LUAD总生存率的主要危险因素
作者基于各因素在训练集中的Z-score矩阵,生成了一个无根聚类树枝图,以显示癌症相关标志之间的距离,观察到,"缺氧 "和 "糖酵解 "仍然彼此接近(图2A)。多变量Cox回归分析表明,缺氧是各种癌症相关标志中唯一显著的总生存率的危险因素(图2B)。缺氧与性别、年龄和总生存状态之间存在显著的相关性(图2C)。多变量Cox回归分析显示,缺氧是总体生存的唯一显著变量(图 2D)。这些研究结果表明,在癌症标志和临床病理特征中,缺氧是I期LUAD总生存的主导危险因素。
02 - 确定参与缺氧的I期LUAD特异性候选基因
WGCNA基于转录组数据和缺氧ssGSEA Z-scores构建一个无标度的共表达网络,共生成48个基因模块(图2E)。在这些模块中,绿色模块与缺氧表现出最高的相关性(图2E)。参与绿色模块的773个基因的模块成员和基因意义表现出高度正相关,观察到HIF1A位于核心部分,与缺氧呈正相关(图2F)。将 "缺氧相关模块 "与4 748个HIF1A在LUAD中的潜在靶点进行交集,在交集中发现了199个候选基因(图2G),将这199个候选基因视为 "第一阶段LUAD特异性缺氧相关基因"。
从LUAD组织、单细胞和细胞系进一步验证了这199个候选基因是稳健的低氧相关基因。根据199个基因的表达谱,采用NMF将254个训练样本分为两个簇,最佳k为2(图3A),与簇2相比,簇1表现出显著的缺氧富集(图3B)。集群1中一些关键标志包括干性、血管生成、炎症、糖酵解和EMT的ssGSEA评分显著升高(图3C)。
在最佳k为2的情况下,来自同一LUAD患者的77个单细胞被分为两个簇(图3D),其缺氧水平不同(图3E)。两簇在PCA分析中表现出绝对的不相似性(图3F),糖酵解和TCA循环的分布比例不同(图3G)。此外,在最佳k为3的情况下,将CCLE的69个LUAD细胞系分为3个簇(图3H),3个簇的缺氧水平逐渐降低(图3I)。PCA分析表明,在缺氧或常氧下培养的样本在体外培养的199个基因表达矩阵明显分为两个不同的组(图3J)。
03 - 建立和验证I期患者总生存期的缺氧相关预后特征
采用LASSO Cox算法在199个候选基因中找出最稳健的预后基因(图4A)。10个基因的合集仍有系数(图4B),整合后建立缺氧相关预后特征。涉及10个基因和训练队列中缺氧ssGSEA Z-scores的相关网络如图4C所示。使用公式,计算出每个样本的缺氧相关预后风险评分(HPRS),并将其归一化为每个队列中的Z-score。如图4D所示, HPRS较高的患者在训练队列中表现出更差的总生存期。在5个独立队列中验证了HPRS的预后价值(图4E-I)。
04 - HPRS和传统特征的预后和预测能力比较
进行Meta分析,分别计算TNM分期分类或HPRS排除训练集的HR:分期分类表现出1.69(图5A)的HR,而HPRS表现出2.87(图5B)的HR。分别绘制生存曲线和评价集合队列的生存差异,以直观地了解分期分类和HPRS的预后价值(图5C&D)。在IA期和IB期亚组中,HPRS均保留了以Z-score为0为分界值的高危亚组的预后分辨能力(图5E&5F)。
对汇总队列中的HPRS、p期(IA和IB)、性别和年龄等4个变量进行多变量Cox回归分析,这4个参数都是I期患者总生存的独立危险因素,而HPRS在这些变量中表现出最高的显著性(图5G)。HPRS的C-指数在这些变量中排名第一,这说明HPRS的预测能力最强(图5H)。在两个不同的时间点上,HPRS比其他参数带来了更多的生存净效益(图5I)。
05 - 构建综合模型,优化I期患者的风险分层和生存预测
作者提取了1316例患者,提交包括HPRS、阶段、性别和年龄在内的4个变量进行递归分割分析。如决策树(图6A)所示,根据两个主要成分定义了三个不同的风险亚组,其中HPRS是最有力的参数,加上年龄(64岁被确定为HPRS-高支的分界点)。HPRS低的患者被定义为 "低危 "组,而 "中危 "组和 "高危 "组则分别以 "高HPRS&年龄<64岁 "和 "高HPRS&年龄≥64岁 "为标签。三个风险亚组之间的总体生存率存在显著差异(图6B)。
将HPRS与其他临床病理特征一起生成一个nomogram,红色箭头显示的是一个例子(图6C)。nomogram对3年和5年生存概率的预测线极度接近理想表现(45度线)(图6D),说明nomogram的准确性很高。与其他临床病理特征相比,nomogram表现出最强大的生存预测能力(图6E)。
06 - 全面分析不同风险群体之间的富集途径和基因组改变
在TCGA队列的HPRS高样本中发现了2 054个显著上调基因和1 579个显著下调基因(图7A)。对这些DEG进行基因本体富集分析,上调基因主要富集于细胞分裂、DNA修复和细胞外基质组织等途径(图7B),而下调基因主要富集于各种代谢过程(图7C)。
每个队列中最常突变的前20个基因如图7D&E所示,在HPRS-高和-低队列之间检测到不同的突变基因。TP53占据了前1位(图7F),这表明与I期患者的缺氧状况有很高的相关性。棒棒糖图揭示了两队患者之间TP53的不同突变点(图7G),并观察到生存差异的似是而非的连锁反应(图7H&I)。此外,在HPRS高的队列中观察到一例独特的KRAS-TP53互斥突变(图7J),这说明它们各自的突变可能诱发了共同的效应,并具有保留一个以上突变拷贝的选择性优势。此外,HPRS高组的肿瘤突变负担(TMB)明显升高(图7K)。
去除种系CNV后,在每个队列中都检测到了显著的扩增和缺失。结果观察到更多的区域被改变在HPRS高的队列(图7L&M)。与HPRS-low队列相比,一些代表性的癌基因如FGFR1、E2F1、KRAS、MET、CDK4和MYC在HPRS-high队列中被广泛扩增(图7N)。KRAS是证明HPRS-high队列中拷贝数与mRNA表达之间正相关的典型例子(图7O)。
07 - 缺氧衍生的信号预测I期患者的治疗反应
基于从MSigDB检索到的不同药物治疗的改变基因集,在训练队列中,高HPRS与耐药性显著相关(图8A)。R包'pRRophetic'用于估计LUAD治疗中使用的四种常见药物的化疗敏感性。这些药物的估计IC50值在训练队列的HPRS高样本中显著升高(图8B)。考虑到IB期患者化疗获益的争议问题,对6个队列进行了筛选,共提取了41例接受辅助化疗的IB期患者,并根据其HPRS Z-score将其分为3组。观察到不同HPRS组间的总生存率有显著差异,说明HPRS可作为一种有前景的生物标志物,指导IB期患者的辅助化疗(图8C)。
考虑到缺氧影响癌症患者免疫治疗的疗效,作者开发了另一个缺氧衍生的基因签名,利用RF和LASSO逻辑算法预测ICB治疗反应。在两个参数的最佳值(图8D)的情况下,将199个I期LUAD特异性缺氧相关候选基因按照其与免疫治疗反应相关的重要性进行排序,并在两种排序方法中重叠了16个基因(图8E)。9个基因(MEGF9、BICD1、TUBB3、ADAMTS4、PI15、FBXO32、ST3GAL4、GPX8、CERCAM)最终保留了系数(图8F)。
在训练队列中,HIRS表现出预测免疫治疗反应的AUC为0.809(图8G)。在测试TCGA队列中, HIRS表现出最高的AUC为0.727(图8H)。HIRS可以完全区分在20只BALB/c小鼠皮下接种AB1-HA细胞接受抗CTLA-4治疗的应答者和非应答者,甚至优于CTLA-4表达(图8I)。
四、结论
在这项研究中,作者发现缺氧是所有癌症相关标志中I期LUAD的主要预后危险因素。建立了两个缺氧相关标志,分别预测I期LUAD患者的总生存期和免疫治疗反应。建立了一个生存决策树来优化风险分层,并生成了一个提名图来量化风险评估。对不同风险组之间的富集途径、基因组改变和CNVs进行了分析和比较。