m6A相关lncRNAs与肿瘤的关系
目前已知的RNA修饰有100多种,其中RNA甲基化修饰占60%以上,而m6A(N6-甲基腺嘌呤)作为高等生物RNA上最为普遍的修饰,近几年的热度只增不减。咱们公众号也先后为大家推了不少该系列的文章,今天继续来看两篇四月份Molecular Therapy-Nucleic Acids(IF=7.032)杂志同一期发表的文章,这两篇文章均探讨了m6A修饰的lncRNAs在肿瘤中的作用。
m6A修饰主要发生在RRACH序列中的腺嘌呤上,其功能由编码器(甲基转移酶)、读码器(结合蛋白)和消码器(去甲基酶)决定(图1)。编码器由METTL3, METTL14, WTAP, RBM15, ZC3H13, VIRMA, CBLL1以及新发现的METTL16组成。m6A读码器包含YTHDF1–3, YTHDC1–2, IGF2BPs, HNRNPs, eIF3, FMRP, Prrc2a, METTL3和LRPPRC等结合蛋白,可以特异性识别m6A甲基转移酶,并影响甲基化的mRNAs,不同的结合蛋白具有不同的功能。消码器负责调控m6A的去甲基化过程,包括FTO, ALKBH5, ALKBH9和ALKBH10B蛋白质。
图1. m6A的组成
第一篇文章的作者Yufei Lan等人总结了m6A修饰对lncRNA功能的调控机制(图2)。一方面,m6A修饰作用于RNA-DNA三螺旋结构,调控lncRNA与特定DNA位点之间的关系;另一方面,m6A修饰为读码器提供结合位点或调控局部RNA的结构,进而诱导RBPs的结合,调控lncRNA的功能。
图2. m6A对lncRNAs的调控机制
多项研究表明m6A和lncRNA在肿瘤的发生发展中都发挥了一定的作用(图3),m6A修饰的lncRNA可以诱导胰腺癌、卵巢癌、肝癌等肿瘤细胞的增殖、迁移和凋亡。例如,Wu等人发现m6A诱导的lncRNA—RP11可以通过上调Zeb1来触发结直肠癌细胞的转移和增殖;IGF2BP2可通过调控lncRNA DANCR的表达,与DANCR共同作用于胰腺癌的细胞增殖和肿瘤的发生;He 等人的研究发现,ALKBH5可以通过去甲基化lncRNA KCNK15-AS1并调控其表达来抑制胰腺癌,为胰腺癌的治疗提供了一个潜在的靶点。
图3. 肿瘤中m6A修饰的lncRNAs
第二篇文章的作者Feng Xu等人利用TCGA中lncRNAs和m6A基因的表达谱,以及LUAD(肺腺癌)患者数据,识别出了m6A相关的lncRNAs作为LUAD预后和免疫反应的潜在标志物(图4)。
作者首先用Pearson相关分析筛选出了与21个m6A基因相关的lncRNAs;然后,LUAD数据集被随机分为训练集和验证集,结合临床信息,通过单变量Cox回归分析进一步筛选与OS相关的lncRNAs,又利用LASSO Cox回归分析识别出24个与OS显著相关的m6A-related lncRNAs;接下来,采用多因素Cox回归分析建立了一个基于12-m6A-related lncRNAs的风险模型,并根据中位数风险得分为低风险组和高风险组,Kaplan-Meier用来分析两组之间的OS差异。此外,还利用药物敏感性数据发现了靶向这些lncRNAs的候选药物。
图4. 流程图
设置阈值 |Pearson R| > 0.3 & p < 0.001,作者识别出1,149个 m6A-related lncRNAs,共表达网络如图5所示。
图5. 识别m6A相关的lncRNAs
利用单变量Cox回归分析,在TCGA数据集中筛选出38个与OS显著相关的m6A-related lncRNAs(图6A)。LASSO-penalized Cox分析筛选出24个m6A-related lncRNAs(图6B-C)做后续的多变量Cox比率风险回归分析,最终被用于构建风险模型来评估LUAD患者预后风险的12个lncRNAs如图6D所示。
图6. 风险模型
图7A为LUAD样本低风险和高风险组之间的风险等级分布情况,两组患者的生存状态和生存时间如图7B所示。生存分析结果表明低风险组的生存期长于高风险组(图7D)。
图7. 训练集中风险模型的预后价值
为检测该风险模型的预后效能,研究分别描绘了测试集(图8A-C)以及整个数据集(图8E-G)的风险等级分布,生存状态和生存时间的模式,以及m6A-related lncRNAs的表达情况。对测试集和整个数据集的Kaplan-Meier生存分析结果与训练集一样,风险评分较高的LUAD患者的OS低于风险评分较低的患者(图8D-H)。
图8. 测试集中风险模型的预后价值
按性别、年龄、分级、分期等临床指标对整个TCGA数据集分组后,研究发现低风险组的OS仍长于高风险组(图9)。
图9. Kaplan-Meier生存曲线
作者分别基于整个基因表达谱、21个m6A基因、12个m6A-related lncRNAs,以及风险模型,进行了PCA以分析低风险组和高风险组之间的差异。发现在基于风险模型得到的结果中,高低风险组具有不同的分布(图10D)。
图10. 主成分分析
基于504个LUAD样本得到的m6A相关lncRNA模型,作者进一步分析了LUAD中几种免疫细胞和通路的富集水平、活性以及功能,发现低风险组与高风险组免疫指标的表达差异显著(图11A)。此外,通过m6A相关lncRNA模型与免疫治疗标志物之间的相关性分析,研究发现高风险组对免疫治疗的反应更好(图11C),这表明该模型可作为一个预测肿瘤免疫功能障碍和排斥的指标。接下来,作者利用R包maftools对突变数据进行了分析,图11D和图11E分别展示了高、低风险组中变异频率最高的前20个驱动基因。然后,基于TGCA体细胞突变数据计算了TMB评分,结果表明该分类指标与TMB具有较高的相关性(图11F)。作者还利用GDSC数据库中的IC50数据,基于thepRRophetic算法筛选出了78种化合物,作为靶向lncRNA模型的LUAD潜在治疗药物。
图11. 利用模型评估免疫治疗反应
单因素和多因素Cox回归分析的结果表明该风险模型独立于其他临床指标,并证实了其可靠性(图12)。
图12. 预后风险模型的评估
作者使用包含风险等级和临床风险特征的列线图来预测1年、2年和3年OS发生率。与临床指标相比,该预测模型表现出显著的预测能力(图13A)。由图13B-D中的相关性图可发现,1年、2年和3年OS的观察率与预测率均具有一致性。
图13.预后列线图的构建和评估
随着MeRIP-seq和m6A测序技术的发展,更多m6A修饰的lncRNAs将会被发现,它们的功能意义也有待挖掘。此外,m6A相关蛋白及其抑制剂的研究也会为癌症的早期诊断、治疗甚至预后提供新的机会。因此,对于m6A,还大有文章可做,希望今天分享的文章能为感兴趣的小伙伴带来一丢丢灵感。Have a nice day!
参考文章:
1. The role of M6A modification in the regulation of tumor-related lncRNAs (PMID: 33996258)
2. m6A-related lncRNAs are potential biomarkers for predicting prognoses and immune responses in patients with LUAD(PMID: 33996259)
生信分析路线生信分析意向表