预测头颈癌预后和治疗反应的新型坏死相关lncRNA特征的建立
A novel necroptosis-related LncRNA signature for prediction of prognosis and therapeutic responses of head and neck squamous cell carcinoma
预测头颈部鳞状细胞癌预后和治疗反应的新型坏死相关LncRNA签名
发表期刊:Front Pharmacol
发表日期:2022 Aug 9
影响因子:5.988
DOI: 10.3389/fphar.2022.963072
一、背景
头颈部鳞状细胞癌(HNSCC)占全球第六大常见癌症,每年有89万新发病例,每年有45万死亡病例。尽管HNSCC的治疗不断取得进展(包括手术、免疫治疗、放疗和化疗等),其发病率和死亡率仍在逐步上升,5年总生存率仅为60%。
作为一种程序化的细胞死亡形式,坏死凋亡通过增加细胞表面的渗透性引发炎症反应,导致细胞内容物的释放。由于强烈的促炎症特征,坏死凋亡在炎症性疾病和病毒防御过程中发挥着重要作用,包括病毒性心肌炎和阿尔茨海默病。最近,研究人员发现,在各种实体肿瘤中,坏死性凋亡通过调节程序性肿瘤细胞死亡来抑制肿瘤的发展和转移。
长非编码RNA(LncRNA)是一种非编码RNA分子,有200个以上的核苷酸。尽管lncRNA的编码能力有限,但它在调节癌细胞行为(分化、迁移和凋亡)和癌症进展方面仍然占有重要作用。
二、材料与方法
1、数据来源
1) 从TCGA和GEO数据库中下载了964个HNSCC样本的基因表达和临床信息,分别为TCGA-HNSC(n=494)、GSE41613(n=97)、GSE42743(n=103)和GSE65858(n=270)数据集
2) 从TCGA GDC网站获得HumanMethylation450阵列和体细胞突变数据;在FireBrowse网站获取拷贝数变异(CNV)数据
3) 从PRISM、CTRP和CCEL数据集获得了药物敏感性信息和基因表达谱
4) 根据MSigDB网站和PubMed数据库中以前的文献,选择了117个Necroptosis相关基因
2 、分析流程
1)鉴定与Necroptosis相关的lncRNA:根据Liu等人的研究,构建了一个管道来识别Necroptosis相关的lncRNAs(NRLs):计算坏死相关基因与每个lncRNA的相关性,将坏死相关基因按降序排列;用 "GSEA "软件包对排名的基因列表进行富集分析,并计算每个lncRNA的Necroptosis富集度得分;根据以下两个标准将lncRNAs确定为NRLs:
单变量cox回归:筛选具有预后价值的NRLs
LASSO回归:在TCGA-HNSC队列中成功构建了NLPS模型,并在GSE41613、GSE42743和GSE65858队列中验证了该模型
2) 对NLPS的评估:通过Kaplan-Meier分析探讨了高风险组和低风险组的预后价值;利用接收操作特征(ROC)和校准曲线来评估NLPS的准确性;通过单变量和多变量逻辑回归分析探讨了调整变量(年龄、性别和AJCC等)后NPLS的独立预后价值
3) 基因组富集分析和基因组变异分析:基因集富集分析(GSEA);'DESeq2'R软件包对高风险组和低风险组的患者进行了差异分析;在'enrichplot'R软件包中对排名的基因列表进行GO和KEGG丰富度分析;使用'GSVA'R软件包中的基因组变异分析(GSVA)来进一步探索两组患者之间明显改变的功能和途径
4) 评价免疫浸润和免疫治疗反应:利用ssGSEA来计算两组患者中28种免疫细胞的浸润丰度;还比较了两个亚组患者之间免疫共刺激和共抑制分子的表达,使用'IOBR'R软件包中的'deconvo_tme'函数来计算每个HNSCC患者的IPS得分;作为一种无监督的聚类方法算法,亚类图谱(SubMap)揭示了独立队列之间的共同亚型;通过计算高风险组和低风险组的患者与接受免疫治疗的黑色素瘤患者的相似性来评估对CTLA-4和PD-1治疗的反应;利用肿瘤免疫功能紊乱和排斥(TIDE)来预测每个病人对免疫检查点抑制剂(ICI)的反应
5) 绘制突变景观图:通过'maftools'R软件包提取每个病人的突变特征,并计算肿瘤突变负担(TMB);比较了两组之间新抗原负荷的差异;进一步探讨FMG的预后价值,应用单变量和多变量逻辑回归分析来计算每个FMG的几率比(OR)值
6) 拷贝数变异和甲基化驱动的基因:GISTIC 2.0算法;通过'MethylMix'R软件包确定了高风险组和低风险组的甲基化驱动基因(MDGs);比较了两组之间的甲基化丰度、表达水平和甲基化频率的差异。
9) 探索潜在的化疗药物:从CCLE、CTRP和PRISM网站收集了基因表达和药物敏感性信息;根据以前的研究,通过计算NLPS评分,将细胞系分为高风险组和低风险组
流程图三、实验结果
01 - NLPS模型的构建
根据mRNA和lncRNA基因的表达,共鉴定了184个坏死相关的lncRNAs(NRLs)。通过单变量COX回归分析了NRLs的预后价值。只有21个NRLs在超过50%的队列中具有独立的预后意义(图2A)。随后,在TCGA-HNSC队列中用LASSO回归算法分析了这21个稳定预后基因的表达信息(图2B,C)。当lambda最小时,成功构建了最佳模型,包括12个NRL。通过NLPS模型,计算出每个病人的风险分数,并根据最佳分界点将他们分为高风险(n = 142)和低风险(n = 352)亚组。与低风险组相比,高风险患者在TCGA-HNSC队列中表现出更差的预后(图2D)。模型在三个验证队列中也得到了类似的证明(图2E-G)。
图2 构建稳健的签名为了评估NLPS模型的稳健性,作者计算了ROC曲线下的面积(AUC)与1、3、5年的OS(图3)。同样,校准曲线也进一步证明了NLPS模型在四个队列中的高准确性(图3D-F)。此外,NLPS在所有队列中都有较高的C指数,分别为0.667(TCGA-HNSC),0.695(GSE41613),0.651(GSE42743),和0.653(GSE65858)。临床特征在患者的临床治疗中占有重要地位,模型是否能独立于临床特征是评价其疗效的关键。如图3G-J所示,多变量回归分析表明,在调整了临床特征(AJCC分期、T、N、M、HPV、吸烟等)后,NLPS仍是一个独立的预后因素。
图3 对NLPS的评价02 - 免疫浸润的丰度在低风险组患者中较高
通过ssGSEA方法,计算了28种免疫细胞的浸润丰度。详见图4A,低危组患者表现出比高危组更丰富的免疫浸润,尤其是活化的CD4 T细胞、活化的CD8 T细胞、中央记忆CD8 T细胞和效应记忆CD8 T细胞。为了更准确地评估免疫分子的丰度,作者进一步比较了两组患者之间免疫共刺激分子和免疫共抑制分子的表达丰度。正如预期的那样,低风险组患者表现出较高的免疫共刺激分子(CD226、CD27、CD28、TNFSF8、SLAMF1等,图4B)和较低的免疫共抑制分子水平(BTLA、BTN2A2、CD274、VTCN1等,图4C)。此外,利用SubMap算法比较两组患者对免疫治疗的反应,低风险组患者对PD-1治疗比高风险组更敏感(图4D)。TIDE和IPS分析发现,低危组患者对ICI的反应率和IPS评分更高(图5A,B),这进一步证明低危组患者有更丰富的免疫浸润,可以从免疫治疗中获益更多。
图4 两组的免疫浸润分析和免疫治疗反应的预测通过GSEA算法探讨了两组之间在GO术语和KEGG通路上的显著差异。如图5D,E所示,高危组患者在侵袭和发育相关的途径中明显富集,如软骨发育、肌肉细胞分化、软骨发育调节、基底细胞癌、钙信号通路等;相反,高危组患者在修复和炎症相关途径中明显富集,如IL-17信号通路、类风湿关节炎、重组修复、减数分裂细胞周期过程等(图5F,G)。值得注意的是,GSVA富集分析显示,两个亚组的患者在不同的功能和途径上都有明显的富集(图5C)。高危组患者在代谢和发育相关的通路中明显富集,如异物代谢、氧化磷酸化、精子生成、血红素代谢等;高危组患者在炎症相关的通路中明显富集,如TGF-β信号传导、IL-2 STAT信号传导、IL-6 JAK STAT信号传导、有丝分裂纺锤体等。
图5 探讨NLPS的潜在机制03 - 高危组中表现出较高的突变频率
最初,计算了每个基因的突变频率,并将突变频率最高的30个基因定义为高频突变基因(FMGs),以瀑布形式显示(图6A)。为了进一步分析两组患者的突变状况,作者比较了高风险组和低风险组患者的FMGs突变差异。如图6B所示,低风险组患者的突变频率高于高风险患者,尤其是TP53和FAT1。随后,通过图表比较了两组的TMB,无论是SNP还是IMDEL,低危组的患者都有较高的TMB(图6C)。TMB是肿瘤新抗原产生的关键,低风险组的患者也有较高的新抗原负荷(图6D)。此外,进一步探讨FMGs突变状态的预后价值。通过单变量和多变量回归分析,发现即使调整了常见的临床变量,TP53和FAT1也是独立的预后因素(图6E,F)。
图6 NLPS的基因组图谱04 - 两组间拷贝数变异和甲基化驱动基因的差异
作者进一步探讨了拷贝数变异(CNV),发现高危组的FGA、FGG、FGL和失臂都明显较高(图7A)。虽然两组之间在臂展、局灶性增高和局灶性丢失方面没有明显差异,但高危组仍然呈现出较高的趋势(图7B)。随后,我们确定了CNV最高的前10个染色体段,并通过单变量和多变量回归评估其预后价值。如图7C,D所示,大多数染色体段的CNV状态是危险因素,但只有9p21.3-del段有独立的预后意义。作为肿瘤表观遗传学中最知名的表观遗传机制之一,DNA甲基化在各种实体瘤的进展中起着重要作用。因此,进一步对HNSCC患者的甲基化谱和基因表达谱进行了关联分析。SVIY和PHYHD1的甲基化水平和转录组水平明显负相关,被确定为MDG(图7E,H)。值得注意的是,与低风险组的患者相比,高风险组MDG的甲基化水平(图7F,I)和甲基化频率更高,而转录组水平则明显较低(图7G,J)。
图7 拷贝数变异和甲基化驱动的基因05 - 高危患者对化疗药物更敏感
以前的研究表明,LCN2、ATM和ATP1的低表达会增加肿瘤细胞对顺铂的敏感性。基于细胞系的基因表达数据和药物敏感性信息,本研究分析得出了相同的结论,这进一步证明了分析管道的准确性(图8A-C)。随后,从CTRP中发现了7种对高危组患者敏感的药物,包括阿法替尼、达沙替尼、氟维司群、吉非替尼、洛伐他汀、尼可刹米和鲁索利替尼(图8D,E)。同样,从PRISM数据库中共发现了11种对高危人群患者敏感的药物,如XL-647、alvespimycin、astenmizole、AVL-292等(图8F,G)。
图8 潜在治疗药物的探索四、结论
作者全面分析了HNSCC的遗传和临床信息,建立了一个稳定的模型(NLPS),可以准确预测HNSCC患者的预后和临床获益,并在不同队列中显示出强大的疗效。此外,还进一步揭示了NLPS的免疫特征、多组学改变和药理图谱,这对预测免疫治疗和化疗的效益具有重要意义。总之,NLPS的建立为HNSCC的临床管理和个性化治疗提供了指导和帮助。