顶刊精读 | 泛癌蛋白质基因组学将致癌驱动因素与功能状态联系起来

2024-08-22  本文已影响0人  BioJournal_Link

Basic Information

Highlights

Para_01

Summary

Para_01
  1. 癌症驱动事件是指推动肿瘤发生的關鍵遗传异常;然而,它们的确切分子机制仍然理解不足。
  2. 在这里,我们的多组学泛癌分析揭示了癌症驱动因素影响的洞见,通过识别它们在RNA、蛋白质和磷酸化蛋白质水平上的显著顺式效应和远端反式效应。
  3. 突出的观察结果包括点突变和拷贝数变异与蛋白质相互作用网络重排之间的关联,值得注意的是,大多数癌症基因趋向于相似的分子状态,这由基于序列的激酶活性谱所表示。
  4. 预测的新抗原负担与测量的T细胞浸润之间的相关性表明了免疫疗法的潜在脆弱性。
  5. 癌症标志的模式根据多基因蛋白质丰度从均匀到异质不等而变化。
  6. 总体而言,我们的工作展示了全面的蛋白质基因组学在理解致癌驱动因素的功能状态及其与癌症发展联系方面的价值,超越了研究单一癌症类型所带来的局限性。

Graphical abstract

Keywords

Introduction

Para_01
  1. 癌症主要由肿瘤抑制基因(TSGs)和原癌基因中的遗传驱动突变引发。
  2. 定义一个基因为癌症驱动因素时会考虑多种指标,包括基因中的突变复发、
  3. 功能性蛋白结构域、
  4. 致癌突变的个别氨基酸热点、
  5. 损害性突变的富集、
  6. 或蛋白质结构中体细胞突变的三维聚类。
  7. 将这些标准应用于大规模的癌症基因组学数据队列后,近年来癌症基因及其预测驱动突变的清单已显著增加。
  8. 这些突变如何机制性地"驱动"肿瘤发生仍不完全清楚。
Para_02
  1. 临床蛋白质组肿瘤分析联盟(CPTAC)通过整合整个蛋白质基因组谱系的数据,加速了对癌症基本分子机制的理解:全外显子组和全基因组测序、DNA甲基化、RNA-seq以及全面的蛋白质组学和磷酸化蛋白质组学。
  2. 迄今为止,已经为涵盖十种癌症类型的1,000多个病例生成了大量的数据:结直肠腺癌(COAD)、卵巢高级别浆液性癌(HGSC)、透明细胞肾细胞癌(ccRCC)、头颈鳞状细胞癌(HNSCC)、肺鳞状细胞癌(LSCC)、子宫体子宫内膜癌(UCEC)、肺腺癌(LUAD)、胰腺导管腺癌(PDAC)、胶质母细胞瘤(GBM)和乳腺癌(BRCA)。
  3. 通过对不同组学层中的变异进行探究,可以追踪体细胞驱动突变对生物结构与功能单位——蛋白质的影响。
Para_03
  1. 泛癌研究侧重于界定多种癌症中的分子特征。在这里,我们通过纳入蛋白质组学层面,扩展了我们先前以基因组为中心的泛癌研究,以阐明癌症驱动因素六个关键方面:(1) 泛癌基因组和表观基因组驱动因素的频率、排他性和共现;(2) 驱动突变对 RNA、蛋白质及翻译后修饰的影响;(3) 驱动突变对蛋白质复合体的影响;(4) 致癌途径中蛋白质和磷酸化水平的关键变化;(5) 可干预的驱动突变与肿瘤微环境之间的关联;以及 (6) 从癌症标志的角度来看,体细胞驱动因素对蛋白质丰度的综合影响。
  2. 我们的发现展示了整合性蛋白质基因组分析在解码致癌驱动因素及其潜在临床应用方面的潜力,特别是在没有明确基因组靶点的情况下。

Results

A pan-cancer proteogenomic landscape of driver alterations and associated multi-omic clusters

全癌种蛋白质基因组景观揭示驱动变异及其相关多组学集群

Para_01
  1. 尽管大规模DNA测序研究对于识别癌症驱动突变至关重要,但蛋白质基因组学进一步整合了表观遗传学、转录组学和蛋白质组学数据,揭示了功能后果及治疗脆弱性。
  2. 作为CPTAC的一部分,我们对来自十个不同癌症类型的1,064个前瞻性收集病例的蛋白质基因组数据进行了统一处理和分析,涵盖了遗传变异、DNA甲基化、转录组、全局蛋白质组学和磷酸化蛋白质组学(图1A)。
  3. 每个病例都附带了匿名临床数据、组织病理学、治疗结果以及在某些情况下来自正常邻近组织(NATs)的详细分子数据(补充表S1)。
  4. 一个显著的进步是纳入了基于质谱的蛋白质组学和磷酸化蛋白质组学数据,这使得定量特征的数量呈指数级增长至15,699种蛋白质和110,274个磷酸化位点(图1B),与癌症基因组图谱(TCGA)基于RPPA的检测中分别评估的128种蛋白质和53个磷酸化位点相比有了大幅增加。


  • 图1. 泛癌症变异景观表征了四个多组学聚类 (A) 队列和数据类型的概览。
  • (B) 蛋白基因组数据类型中的量化特征及H&E图像的数量。
  • (C) 我们将这个泛癌症队列中的肿瘤样本分为四个多组学层次聚类。
  • 它们在蛋白基因组方面展示了肿瘤变异性,如驱动变异(顶部),以及与每个聚类相关的差异表达蛋白质(DEP)、潜在的蛋白质-蛋白质相互作用(DEPP)和富集途径(中部和底部)。
  • (D) 这是按多组学聚类分组的增殖和EMT信号通路中蛋白质组数据的ssGSEA小提琴图。
  • 显示了一元ANOVA的p值,数据表示为平均值±CI。
  • 另见补充图S1和补充表S1。
Para_01
  1. 为了揭示转录组、蛋白质组和磷酸化蛋白质组中肿瘤变异性的全景,我们应用了贝叶斯非负矩阵分解28,29,30后接着进行层次聚类,对肿瘤样本进行了聚类分析。
  2. 我们解析出了四个主要的多组学聚类(聚类A至D)(图1C;星号标记的方法)。
  3. 聚类A中缺乏胰腺导管腺癌(PDAC),但富集了高级别浆液性卵巢癌(HGSC)和结直肠腺癌(COAD),与较高比例的微卫星不稳定性(MSI-high)和免疫冷型样本相关(p值分别为0.02、1e-5,卡方检验;星号标记的方法)。
  4. 聚类B含有更多的鳞状细胞癌,并且与其他聚类相比具有更高的免疫浸润(p值=1e-5,卡方检验)。
  5. 聚类C和D分别在肺腺癌(LUAD)和胶质母细胞瘤(GBM)中富集,它们具有相似之处,例如更高比例的免疫热型样本(图1C)。
  6. 值得注意的是,某些致癌性改变偏好性地发生在特定聚类中(q值<0.05,卡方检验),比如KRAS突变在聚类C和D中,以及CDKN2A和TP53突变在聚类B中(图1C;补充表S1)。
  7. 此外,我们鉴定了差异表达蛋白(DEPs)和差异磷酸化位点(DEPPs)(图1C;补充表S1)。
  8. 功能上,与聚类A相关的DEPs在雌激素依赖的基因表达中富集,而DEPPs则与DNA修复有关。
  9. 聚类B中的DEPs和DEPPs在DNA复制、固有免疫系统和细胞周期中富集,这与大量CDKN2A改变相一致。
  10. 与聚类C相关的DEPs和DEPPs与细胞外基质(ECM)组织和VEGFA-VEGFR2信号传导有关。
  11. 最后,聚类D在酪氨酸代谢和MAPK1/MAPK3信号传导中富集(图1C)。
Para_02
  1. 接下来,我们使用基于蛋白质的单样本基因集富集分析(ssGSEA)量化了每个多组学聚类中富集的代表性通路在不同癌症类型间的差异(图1D和补充图S1A;补充表S1)。
  2. 例如,在每个聚类中,ccRCC的免疫系统通路ssGSEA得分比GBM高(补充图S1A),这与已知的ccRCC具有更高的免疫浸润水平以及对免疫检查点阻断更好的响应率一致。
  3. 为了评估临床相关性,我们在共聚类肿瘤中进行了生存分析。
  4. 经过多重检验校正后,我们发现标记为组A(即富含PDAC样本)的ccRCC样本在聚类C和D中的预后优于对照组(即聚类A和B中的ccRCC样本)(补充图S1B);这一关系在Cox比例风险模型中调整年龄、性别和肿瘤纯度后仍然保持(p值=0.008)。
  5. 通过比较ccRCC中组A和组B的炎症反应蛋白基ssGSEA得分,我们注意到组A对应的免疫浸润水平较低(补充图S1C)。
  6. 当我们根据炎症反应ssGSEA得分将ccRCC样本分组时,观察到了生存优势(补充图S1D)。
  7. GBM在上皮间充质转化(EMT)通路上的得分高于其他癌症类型,特别是在聚类D中(图1D)。
  8. GBM的间充质亚型表达神经干细胞标志物,并与侵袭性表型相关联。
  9. ssGSEA得分高的GBM亚群与患者较差的生存率相关联(p值=0.0062;补充图S1E;星号方法部分)。
  10. 基于它们的多组学特征对所有癌症病例进行全面审视使我们能够识别出不同的样本聚类。
  11. 然而,这些样本中的癌症驱动因素与分子通路差异之间可能存在何种联系?
  12. 我们首先探究了最明显可能的影响:改变的驱动基因对其RNA和蛋白质产物的影响。


  • 图 S1. 驱动突变注释流程及多组学聚类,与图 1 相关 (A) 小提琴图显示了免疫系统途径中从单样本基因集富集分析(ssGSEA)得出的蛋白质组数据癌症类型途径富集得分分布,按多组学聚类分组。显示了一元方差分析 P 值,数据表示为平均值 ± 置信区间。
  • (B)ccRCC 中群组 A(即聚类 C 和 D)与群组 B(即作为对照的聚类 A 和 B)之间总体生存期(即 OS)差异,由 Kaplan-Meier 图表示。对数秩检验 P 值 = 0.01。调整年龄、性别和肿瘤纯度后,Cox 比例风险模型得到的 P 值为 0.008。须状线代表风险比的 ± 95% 置信区间。
  • (C)小提琴图比较了两个 ccRCC 群组间基于蛋白质的 ssGSEA 得分(即炎症反应标志途径)的分布,如 B 所示。Wilcoxon 符号秩检验得到的 P 值为 0.00011。数据表示为平均值 ± 置信区间。
  • (D)整个 ccRCC 队列中高炎症反应组(炎症反应 ssGSEA 上四分位数)与低炎症反应组(例如,下四分位数)之间的总体生存期(即 OS)差异,由 Kaplan-Meier 图表示。对数秩检验 P 值 = 0.0027。调整年龄、性别和肿瘤纯度后,Cox 比例风险模型得到的 P 值为 0.011。高:炎症反应 ssGSEA 上四分位数;低:炎症反应 ssGSEA 下四分位数。
  • (E)CPTAC 胶质母细胞瘤队列中总体生存期与上皮间质转化(EMT)ssGSEA 得分表达之间的关联,由 Kaplan-Meier 图表示。高 EMT ssGSEA 得分(队列的上四分位数)与较差的生存显著相关,由对数秩检验 P 值指示。
  • (F)条形图显示了六种方法预测的驱动错义突变的数量,进一步根据 OncoKB 是否已知该突变为致癌性(蓝色)或未知(橙色)进行分层。
  • (G)Upset 图指示了计算方法之间预测的驱动错义突变的重叠情况。
  • (H)条形图显示了预测一个错义突变为致癌性的计算方法数量与其在 OncoKB 中的支持程度之间的关系。我们独立使用所有六种计算方法(STAR 方法)对错义突变进行分类,然后根据多少种独立的方法识别出每个突变进行计数。x 轴表示这六种方法中有多少种识别出一个特定突变为潜在的驱动突变。被更多计算方法识别的错义突变更可能包含较高比例的驱动变异。左侧面板显示各组突变的绝对数量,右侧面板呈现各组突变的百分比。
  • (I)左,文氏图指示潜在的失活功能(pLOF)变异被 OncoKB(癌症类型无关)或 TCGA PancanAtlas(癌症类型特异性)的肿瘤抑制基因(TSG)分类标记为致癌性的重叠情况。右,两种 pLOF 致癌性注释方法中基因长度与 pLOF 变异频率之间的相关性。阴影区域代表 95% 置信区间。
  • (J)条形图显示了按突变类型(pLOF、框内插入缺失或错义突变)分层的标注驱动突变的基因频率。
  • (K)文氏图显示了 OncoKB 与癌症基因普查(CGC)之间关于拷贝数改变(CNAs)致癌性注释的重叠。
  • (L)条形图显示了导致框内事件的基因融合的对数几率比,按驱动基因类型(癌基因或肿瘤抑制基因,TSG)和融合事件频率分层。误差棒代表 ±1 SEM。
  • (M)在定义的肿瘤样本比例高于背景突变率(效应大小具有 90% 的统计功效)的情况下检测癌症驱动基因的统计功效被描绘出来。圆圈表示 CPTAC 和 TCGA 中的十种癌症类型,根据研究样本量和中位背景突变率放置。

Proteogenomic analyses reveal the heterogeneity of cis-effects of cancer mutations

蛋白质基因组分析揭示了癌症突变的顺式效应异质性

Para_01
  1. 尽管遗传变异能够广泛影响蛋白质组,最直接的影响是在突变基因自身的转录、翻译及转录后产物上。
  2. 为了探究这类顺式效应,我们评估了潜在癌症驱动基因突变与其RNA、蛋白质或磷酸化蛋白水平变化之间的关联,采用线性回归模型(图2A;补充表S2;STAR方法)。
  3. 我们在59个癌症基因中发现了265个显著的顺式事件,在泛癌水平上(q值<0.1,图2B;补充表S2)。
  4. 正如预期,肿瘤抑制基因如ARID1A、MSH6或RB1在其RNA、蛋白质或磷酸化蛋白水平上倾向于下调。
  5. 针对每种肿瘤类型单独分析,我们在59个癌症基因中发现了349个顺式效应(q值<0.1)。
  6. 大多数与泛癌分析中的顺式效应重叠,但仍有一些是独特的,包括LSCC中的CUL3突变、HNSCC中的NOTCH1突变以及UCEC和BRCA中的KMT2C突变,所有这些突变均与较低的蛋白质丰度相关(补充表S2)


  • 图2. 在CPTAC队列中癌症基因中的SNVs的顺式效应 (A) 本图的分析结构的示意图。通过比较突变和野生型样本来衡量体细胞突变对RNA、蛋白质及磷酸化组学的影响。 (B) 本文档中分析的不同顺式效应的概览,在泛癌(顶部)和队列特异性水平(底部)。热图显示选定的频繁突变基因(x轴)在RNA、蛋白质或磷酸化水平(y轴)上的顺式效应,并在所有三个组学水平上进行测量。方块根据顺式效应的符号log10(p)从红色(正数)到蓝色(负数)着色。符号log10(p):将系数的方向乘以调整后的p值的log10(上限为±10)。 (C) 根据ARID1A突变状态(x轴),泛癌中ARID1A突变肿瘤(红色)与非突变肿瘤(黑色)以及正常邻近组织(灰色)的ARID1A蛋白水平(y轴)的比较。 (D) 根据STK11突变状态(x轴),LUAD患者中STK11突变肿瘤(红色)与非突变肿瘤(黑色)以及正常邻近组织(灰色)的STK11蛋白水平(y轴)的比较。显示了一元ANOVA p值,并以中位数和四分位间距表示数据(图2C)和(D)。 (E) 调整了RNA表达水平后,与蛋白质丰度相关的致癌错义突变的顺式效应分析,要么是在泛癌(顶部)级别,要么是在队列特异性水平(底部)。箱形图显示具有潜在驱动错义突变的肿瘤样本(红色)与野生型肿瘤样本(灰色)的比较。显示了Wilcoxon秩和检验q值,并以中位数和四分位间距表示数据。 (F) 泛癌中不同类型的TP53突变(x轴)对于TP53蛋白丰度的顺式效应。 (G) 具有潜在驱动错义突变的癌基因(红色)与肿瘤抑制基因(蓝色)的氨基酸残基相对溶剂可及性(RSA)的比较。RSA评分表明氨基酸是否暴露在蛋白质表面(高分)或被埋藏(低分)。 (H) 具有潜在驱动错义突变的PTEN中氨基酸的RSA与所有剩余氨基酸的比较。显示了Wilcoxon秩和检验p值,并在(F)-(H)中以中位数和四分位间距表示数据。 (I) 显示预测的致癌错义突变在PTEN中的RSA的蛋白质结构。另见图S2和表S2。
Para_01
  1. 将这种分析扩展到配对的邻近非肿瘤组织(NATs)为一组基因的动力学提供了额外的见解。
  2. 尽管聚焦于肿瘤的分析表明ARID1A中的体细胞突变与较低的ARID1A蛋白丰度相关,但NAT表征揭示了令人惊讶的现象:没有ARID1A突变的肿瘤其ARID1A蛋白丰度比配对的NAT更高(P值=1e-16,图2C和S2A)。
  3. 在没有ARID1A突变的肿瘤样本中ARID1A蛋白水平升高的原因尚不清楚。
  4. 配对的NAT也允许进一步探究STK11的顺式效应。
  5. 肺腺癌(LUAD)中的STK11突变与蛋白质丰度下降相关。
  6. 野生型(WT)STK11肿瘤显示出较高的STK11蛋白丰度,但比匹配的NAT的蛋白丰度低(P值=1e-10,图2D),这表明STK11的下调对于没有STK11体细胞突变的肺癌同样至关重要。
  7. 包括NAT样本可以为理解顺式效应如何相对于野生型肿瘤改变蛋白质水平以及相应正常组织中的蛋白质丰度提供背景信息。
Para_02
  1. 虽然某些类型的变异预计会对蛋白质水平产生特定的顺式影响(例如,无义突变和移码插入缺失),但其他变异如错义突变的影响则可能广泛变化。
  2. 为了评估错义突变是否会影响癌症基因中的蛋白质稳定性,我们首先通过回归去除RNA表达的贡献来标准化蛋白质丰度(见STAR方法)。
  3. 在对潜在致癌性错义突变进行顺式效应分析后,我们发现了11个泛癌症显著事件和15个队列特异性显著事件(q值 < 0.05,图2E;补充表S2)。
  4. 正如预期的那样,TP53的错义突变与较高的蛋白质丰度相关联,而移码插入缺失和无义突变则与较低的蛋白质丰度相关联(图2F)。
  5. 对于所有其他具有顺式效应的肿瘤抑制基因,致癌性错义突变与较低的蛋白质丰度相关联,这在STK11、PBRM1和PTEN中可以看到(补充表S2)。
  6. 与对蛋白质稳定性的冲击一致,这些错义突变优先发生在蛋白质结构中被埋藏的氨基酸上(p值 = 0.03,图2G;补充表S2)。
  7. 例如,PTEN在被埋藏的氨基酸上显示出对潜在驱动型错义突变的显著偏好(p值 = 3e−12,图2H;补充表S2),特别是那些计算预测为致癌性的错义突变(图2I)。
  8. 根据之前的饱和突变筛选,这些计算预测的致癌性突变显示出像已知的OncoKB中的致癌性突变一样的低PTEN磷酸酶活性(补充图S2B)。
  9. 然而,与先前已知的致癌性错义突变不同,它们表现出较低的蛋白质丰度(补充图S2C)。
  10. 通过蛋白质基因组学方法的独特能力,这些结果凸显了致癌性错义突变在降低某些肿瘤抑制因子蛋白质丰度方面未被充分认识的作用(补充图S2D)


  • 图S2. 支持错义突变顺式效应的佐证,与图2相关 (A) 在匹配的正常相邻组织(NATs)和野生型肿瘤样本之间比较ARID1A蛋白丰度,突显了我们最初的泛癌症观察结果在队列层面对于大多数癌症类型的一致性。显示了Wilcoxon符号秩检验的p值。箱线图表示四分位间距(IQR,例如,中位数、0.25和0.75分位数),须状图表示1.5倍IQR范围内的最大和最小值。
  • (B)箱线图展示了Mighell等人研究中的饱和突变筛选得到的PTEN磷酸酶活性38,针对在CPTAC中具有不同程度致癌证据的错义突变。显示了Wilcoxon符号秩检验的p值。**表示p值小于0.01,****表示p值小于0.0001。箱线图表示四分位间距(IQR,例如,中位数、0.25和0.75分位数),须状图表示1.5倍IQR范围内的最大和最小值。
  • (C)箱线图展示了Matreyek等人研究中的饱和突变筛选得到的PTEN蛋白丰度39,针对在CPTAC中具有不同程度致癌证据的错义突变。显示了Wilcoxon符号秩检验的p值。*表示p值小于0.05。箱线图表示四分位间距(IQR,例如,中位数、0.25和0.75分位数),须状图表示1.5倍IQR范围内的最大和最小值。
  • (D)条形图展示了仅通过计算预测为致癌的错义突变对蛋白丰度的顺式效应(按RNA表达标准化)。虚线表示统计显著性(q值小于0.05)。

Inference of altered protein-protein interactions through protein co-variation analysis

通过蛋白质协同变异分析推断改变的蛋白质-蛋白质相互作用

Para_01
  1. 体细胞突变可能会改变蛋白质-蛋白质相互作用(PPI)。
  2. 虽然CPTAC中没有直接测量PPI,但已知的蛋白质相互作用对显示出较高的蛋白质共表达(图3A)。
  3. 我们发现,在更多的PPI数据库中被标注的蛋白质对具有更高的相关性值。
  4. 例如,在BRCA队列中,随机蛋白质对的平均皮尔逊相关系数约为0,而被三个或更多数据库代表的PPI的这一系数为0.23(图3B),如MSH2和MSH6之间的相互作用(图S3A)。
  5. 我们将蛋白质水平间的显著相关性作为PPI间接证据(STAR方法)使用。


  • 图3. 通过蛋白质共变异分析推断改变的蛋白质-蛋白质相互作用 (A) 概念图显示已知的蛋白质-蛋白质相互作用倾向于具有比那些未知交互更高的蛋白质共表达水平。 (B) 小提琴图指示随着支持特定蛋白质-蛋白质相互作用的数据库数量增加,蛋白质-蛋白质丰度间的皮尔逊相关系数。显示了威尔科克森秩和检验的p值。 ∗∗ 表示 p值 < 0.01 和 ∗∗∗ 表示 p值 < 0.001。数据表示为平均值 ± 置信区间。 (C) 热图显示癌症驱动基因与已知蛋白质相互作用者(x轴)之间的蛋白质丰度相关性,按癌症类型(y轴)变化。相关性用它们的符号对数10 p值着色,红色表示正相关,蓝色表示负相关。 (D) 散点图示例表明癌症驱动基因与蛋白质相互作用者之间的蛋白质丰度相关性因癌症类型而异(左图,mTOR与RPTOR;右图,mTOR与RICTOR)。显示了相关性检验的p值。 (E) 火山图指示根据潜在致癌拷贝数异常(CNAs)在癌症驱动基因中的存在情况,差异表达的蛋白质。左侧文本标签表示癌症驱动基因,右侧表示蛋白质相互作用者。水平虚线表示统计显著性的阈值(q值 < 0.1)。 (F) 图表指示调解分析试图确定拷贝数异常(CNA)(暴露,X)的跨效应(结果,Y)是否通过潜在癌症驱动基因(中介,M)的蛋白质丰度改变而发生。 (G) 盒图指示在RICTOR扩增肿瘤中MAPKAP1蛋白丰度的上调(跨效应)。 (H) 盒图指示在RICTOR扩增肿瘤中RICTOR蛋白丰度的上调(顺效应)。瓦尔德检验评估统计显著性,并在 (G) 和 (H) 中将数据表示为中位数和四分位间距。 (I) 散点图显示RICTOR野生型肿瘤样本中RICTOR与MAPKAP1蛋白水平的相关性。瓦尔德检验评估统计显著性。 (J) 火山图指示当肿瘤含有潜在致癌突变时,与癌症驱动基因关联增强或减弱的蛋白质。 (K) 散点图显示根据肿瘤是否存在SMAD4致癌突变,SMAD2与SMAD4蛋白水平的相关性。显示了相关性检验的p值。 (L) SMAD4(棕褐色)与SMAD2(蓝色)复合物的蛋白质结构(PDB:1U7V)。可能具有致癌性的突变氨基酸残基以球形表示。 (M) 散点图显示根据肿瘤是否存在PPp2R1A致癌突变,磷酸酶2A调节亚单位(PPP2R2A和PPP2R5E)与PPP2R1A蛋白水平的相关性。显示了相关性检验的p值。 (N) 磷酸酶2A全酶的蛋白质结构(PDB:2NPP),由PPP2R1A(黄色)、PPP2CA(灰色)和一个调节亚单位(紫色)组成。可能具有致癌性的突变氨基酸残基以球形表示。另见补充图S3和补充表S3。
  • r代表(D),(I),(K)和(M)中的皮尔逊相关系数。
  • 补充图 S3. 通过蛋白质共变异分析推断改变的蛋白质-蛋白质相互作用,与图 3 相关 (A) 在乳腺癌 (BRCA) 中 MSH2 和 MSH6 蛋白质丰度之间的皮尔逊相关性。阴影区域表示回归线的 95% 置信区间。显示了相关性检验的 p 值。
  • (B) 四种癌症类型中 CTNNB1 和 CDH1 蛋白质丰度之间的皮尔逊相关性。阴影区域表示回归线的 95% 置信区间。显示了相关性检验的 p 值。
  • (C) 条形图显示了介导分析对每个驱动基因(标签左侧)统计显著性的结果,这些基因受到拷贝数变异 (CNAs) 的影响,进而影响蛋白质互作伙伴(标签右侧)的丰度。
  • (D) 箱形图显示根据 RICTOR 拷贝数状态分层的 mTOR 蛋白质丰度分布。显示了威尔科克森符号秩检验的 q 值。箱体代表四分位距 (IQR,例如,中位数、0.25 和 0.75 分位),须线代表 IQR 的 1.5 倍范围内的最大和最小值。
  • (E) 在没有 RICTOR 扩增的肿瘤样本中 RICTOR 和 mTOR 蛋白质丰度之间的皮尔逊相关性。
  • (F) 根据 CCNE1 拷贝数状态分层的 CDK2(左侧)和 CCNE1(右侧)蛋白质丰度分布。显示了威尔科克森符号秩检验的 q 值。箱体代表四分位距 (IQR,例如,中位数、0.25 和 0.75 分位),须线代表 IQR 的 1.5 倍范围内的最大和最小值。
  • (G) 在没有 CCNE1 扩增的肿瘤样本中 CDK2 和 CCNE1 蛋白质丰度之间的皮尔逊相关性。显示了相关性检验的 p 值,r 表示皮尔逊相关系数。
  • (H) 在具有 CCNE1 扩增的样本与野生型 (WT) 样本之间,激酶库的富集情况。细胞周期相关的 CDKs (CDK1-6) 在具有 CCNE1 扩增的样本中显著富集。x 轴 (log2FF) 表示每种激酶在具有 CCNE1 扩增的样本与 WT 之间的预测频率的对数比值,y 轴表示基于费舍精确检验的统计显著性。
  • (I) 交互项回归模型中 p 值分布的分位-分位图,用于突变对蛋白质-蛋白质相互作用的影响,在置换 (左) 或观察到 (右) 的数据上。
  • (J) 在 1000 组置换数据集 (蓝色) 上使用交互项回归模型得出的显著事件数量与观察到的数据 (红线) 的分布。
  • (K) 随着数据量增加,从交互项回归模型得出的显著事件数量的子采样分析。
  • (L) 散点图显示了 LEF1 和 CTNNB1 蛋白水平之间的相关性,按肿瘤是否具有 CTNNB1 的致癌突变进行分层。
  • (M) 散点图显示了 ARID2 和 PBRM1 蛋白水平之间的相关性,按肿瘤是否具有 PBRM1 的致癌突变进行分层。
  • (N) 散点图显示了磷酸酶 2A 调节亚基 (PPP2R5D 和 PPP2R5B) 和 PPP2R1A 蛋白水平之间的相关性,按肿瘤是否具有 PPP2R1A 的致癌突变进行分层。显示了相关性检验的 p 值,r 表示皮尔逊相关系数 (补充图 S3L-S3N)。
  • (O) 使用蛋白质组学与 RNA-seq 数据时,交互项回归模型中显著事件的重叠。
  • (P) 火山图总结了受其中一个相应蛋白质界面位点磷酸化水平显著影响的蛋白质-蛋白质相互作用 (PPIs),括号内标出位点。泛癌症测试将队列作为模型中的协变量。
  • (Q) 将 EGFR T693 磷酸化位点映射到 EGFR 同源二聚体的三维模型上,表明该位点位于二聚体相互作用的胞内界面上。
  • (R) 散点图指示了 EGFR T693 位点的磷酸化如何影响 EGFR 和 GRK2 蛋白水平之间的相关性。显示了相关性检验的 p 值,r 表示皮尔逊相关系数
Para_01
  1. 首先,计算了CPTAC队列中至少涉及一个癌症基因的已确立蛋白质相互作用(PPI)中的蛋白质对之间的相关性(星号方法;图3C)。
  2. 这揭示了一组保守的核心PPI,例如MSH2/MSH6、CTNNA1/CTNNB1和RAD21/STAG1。
  3. 有趣的是,大多数涉及癌症基因的PPI仅在一部分队列中相关,提示组织特异性。
  4. 例如,已知mTOR与RICTOR和RPTOR两者相互作用,但我们注意到,在ccRCC中,mTOR蛋白丰度与RICTOR相关而与RPTOR不相关,而在GBM中情况相反,与RPTOR相关但与RICTOR不相关(图3D)。
  5. 类似地,在BRCA和UCEC中观察到CTNNB1和CDH1蛋白水平的相关性,但在ccRCC和HGSC中未见这种相关性(图S3B)。
  6. 这些结果突出了不同癌症类型中PPI的可塑性以及同时测量蛋白质水平和RNA的重要性。
Para_02
  1. 接下来,我们将蛋白质共表达作为蛋白质相互作用的指标的概念扩展到了显示拷贝数变异(CNAs)的驱动基因。
  2. 我们发现了32个已知的驱动基因相互作用者显著差异表达(q值 < 0.1),这些相互作用者与驱动基因的CNA状态相关(图3E;补充表S3),包括SMAD4缺失与降低的SMAD2蛋白水平相关联以及CCNE1扩增与增加的CDK2相关联。
  3. 我们进行了中介分析来评估CNA产生的跨效应是否确实通过驱动基因的蛋白质丰度介导,而不是CNA内的无关基因(图3F和S3C;STAR方法部分)。
  4. 我们发现大多数蛋白质-蛋白质相互作用(PPI)的跨效应(66%)与驱动基因的蛋白质丰度有关(q值 < 0.1,自然效应模型;补充表S3)。
  5. 例如,在泛癌水平上,RICTOR的拷贝数扩增与MAPKAP1(图3G)及mTOR(图S3D)的蛋白质丰度增加相关联,这可以分解为对RICTOR蛋白质水平的顺效应(图3H)以及RICTOR与MAPKAP1/mTOR之间的蛋白质水平的跨效应,无论CNA状态如何(图3I和S3E)。
  6. 同样地,在CCNE1扩增的肿瘤中观察到的CDK2蛋白水平升高可以分解为顺效应和跨效应(图S3F和S3G)。
  7. 在磷酸化水平上,根据激酶库,CCNE1扩增的肿瘤也显示出含有CDK2的CDK蛋白亚家族活性增强(图S3H),这为我们结果提供了额外的支持证据。
Para_03
  1. 体细胞突变可以通过改变蛋白质之间的相互作用界面来改变蛋白质相互作用。
  2. 我们使用一个相互作用项回归模型(图S3I至S3K;STAR方法),测试驱动基因中的潜在致癌突变是否显著改变了蛋白质相互作用者的共变异。
  3. 在控制癌症类型和肿瘤纯度的泛癌分析中,我们发现了51个显著事件(图3J;表S3),影响了蛋白质相互作用。
  4. 例如,CTNNB1中的致癌突变与LEF1显示出明显增强的正相关性(图S3L),LEF1是已知的WNT/β-连环蛋白途径效应物。
  5. 相反,PBRM1中的致癌突变消除了PBRM1蛋白丰度与ARID2之间的强相关性(图S3M),这与已知的PBRM1蛋白稳定性依赖于ARID2的情况一致。
  6. 同样,SMAD4中的几个致癌点突变与SMAD2的相关性降低有关(q值=0.02;图3K),提示可能失去了蛋白质间的相互作用。
  7. 这一假设得到了SMAD4中错义突变位于SMAD2蛋白界面上的支持(图3L)。
  8. 最后,作为磷酸酶2A全酶支架蛋白的PPP2R1A中的致癌突变消除了与控制磷酸酶特异性的调节亚单位子集的相关性,包括PPP2R2A、PPP2R5E和PPP2R5B(图3M和S3N)。
  9. 致癌错义突变同样位于PPP2R1A和调节亚单位界面上(图3N)。
  10. 值得注意的是,这些观察结果在RNA表达分析中被遗漏了,突出了蛋白质组学的独特优势(图S3O)
Para_04
  1. 最后,我们研究了磷酸化水平对蛋白质相互作用的潜在影响。
  2. 在泛癌症水平上,涉及驱动基因的39个蛋白质-蛋白质相互作用(PPI)受到磷酸化水平的显著影响(p值 < 0.001),而在队列特异性水平上,则有59个PPI受到影响。
  3. 表皮生长因子受体(EGFR)在T693位点的磷酸化,特别是在ccRCC中,似乎影响了EGFR与多个蛋白伴侣之间的相关性(图S3P)。
  4. EGFR的3D模型显示,T693位于EGFR二聚体的细胞内界面上,该位点的磷酸化对EGFR二聚体形成产生负面影响(图S3Q)。
  5. 表现出高EGFR-T693磷酸化的患者显示出EGFR蛋白与其下游EGFR结合伴侣之间的相关性降低(图S3P和S3R)。
  6. 总之,分析CNA、单核苷酸变异(SNVs)以及磷酸化对蛋白质共变的影响是一种理解癌症中交互网络重排的潜在有力方法。

trans-effects of somatic mutations in cancer genes across the CPTAC cohort

跨CPTAC队列中癌症基因体细胞突变的转效应

Para_01
  1. 体细胞突变的影响可以超越其自身蛋白质产物的顺式效应或直接相互作用。
  2. 这些更远距离的反式效应揭示了可以从驱动基因改变中产生的广泛分子扰动。
  3. 一个癌症基因的所有反式效应的总和可以被认为是它的"分子指纹"。
  4. 我们假设这些分子指纹能够评估不同突变癌症基因对之间的相似性,并推断功能关系(图4A)。
  5. 为了识别这些基因对,我们计算了每个驱动基因的蛋白质组学和磷酸化蛋白质组学反式效应特征之间的相关性(图4B;STAR方法)。
  6. 尽管大多数驱动基因相似性得分表明存在轻微的正相关(r > 0),但少数几个基因对表现出更为极端的正相关和负相关(图4B)。
  7. 反式效应最相似的两个癌症基因是KEAP1和NFE2L2。
  8. KEAP1已知能结合并随后标记转录因子NFE2L2以便降解。
  9. 这两种蛋白质的所有反式效应之间具有高度的整体相关性(r > 0.63,p值 < 1e-15,图4C),这表明这两种基因突变在整体上的细胞效应是相同的:增强NFE2L2的蛋白稳定性以及随后其转录靶标的过度表达。
  10. 这与这两个基因突变互斥的事实一致(图4D)。
  11. 这两个基因最强的反式效应是上调NFE2L2的靶标,如AKR1C2和AKR1C3(图4E)。


  • 图4. CPTAC队列中癌症基因体细胞突变的跨效应 (A) 基于CPTAC的蛋白质组学和磷酸化蛋白质组学数据计算驱动基因跨效应相似性的概述。
  • 显示CPTAC中所有可能的癌症基因对之间跨评分(即,符号化的log10(p))的皮尔逊r值分布的直方图(x轴)。
  • 显示KEAP1(y轴)与NFE2L2(x轴)之间跨效应评分(即,符号化的log10(p))的散点图。
  • 显示KEAP1和NFE2L2之间的蛋白复合物三维结构(顶部,PDB 3WN7)以及展示这两个基因改变的CPTAC样本的肿瘤图。
  • 显示根据KEAP1和NFE2L2突变状态分层的每个CPTAC样本中由NFE2L2调控的四种蛋白质(AKR1C2、AKR1C3、SRXN1和AKR1B10)的详细蛋白质水平(y轴)的箱线图。
  • 显示STK11突变(y轴)或EGFR突变(x轴)对所有测量的蛋白质和磷酸化蛋白质的跨效应的散点图。相关性检验p值已给出,(A)、(C)和(F)中的r代表皮尔逊相关系数。
  • 显示基于EGFR和STK11突变状态的每种CPTAC样本中两种磷酸化事件(PTPN11 pY62和IRS2 pS1100)的详细蛋白质水平(y轴)的箱线图。
  • 显示不同CPTAC队列中根据EGFR突变状态的PTPN11 Y62磷酸化水平(y轴)。显示威尔科克森等级和检验p值,并以中位数和四分位距表示数据。
  • 基于激酶库分析具有特定突变的肿瘤中的泛癌激酶活性。对于每个激酶和条件,气泡颜色(log2FF)表示突变肿瘤与野生型肿瘤预测频率之间的log2比率,气泡大小表示费舍精确检验的统计显著性。
  • 基于激酶库推断的LUAD中激酶活性的蛋白家族分布。
  • EGFR突变、KRAS突变和STK11突变的LUAD肿瘤中基于激酶库分析的激酶活性。另见补充图S4和补充表S4。
Para_01
  1. 尽管大多数癌症基因显示出正相关性,表明相似的跨效应,我们也观察到了负相关性,例如 TP53 和 PTEN、TP53 和 CDH1、EGFR 和 KRAS、以及 EGFR 和 STK11 之间的负相关性,其中最后一个例子具有最强的负相关性(r < -0.54,p 值 < 1e-15,图 4F)。
  2. EGFR 和 STK11 这对基因有几个跨效应是相反的,具体取决于癌细胞是否存在 EGFR 或 STK11 的突变,包括几个磷酸化位点,如 TP53BP2 S704 和 IRS2 S1100(这两个位点在 STK11 突变样本中增加而在 EGFR 突变样本中减少)或 WIPF S155 和 PTPN11 Y62(在 EGFR 突变实例中增加,反之亦然,图 4G)。
  3. 此外,与野生型样本相比,这些事件中的大多数在两个方向上对于 EGFR 和 STK11 来说都是统计学显著的(图 4G)。
  4. 值得注意的是,这些影响大多独立于 EGFR 内突变的具体位置(图 4H)。
  5. 这些结果表明 EGFR 和 STK11 的突变可能将正常细胞推向相反的致癌状态。
Para_02
  1. 接下来,我们研究了突变对细胞磷酸化状态的跨癌症水平的转效应。
  2. 我们在所有癌症类型中比较了突变样本与野生型样本之间预测的激酶活性(图4I和补充图S4B;补充表S4)。
  3. 例如,ACVR2A和TP53的突变显示出细胞周期和剪接激酶的激活;当PIK3CA发生突变时,众所周知的致癌基因显示出了PI3K/AKT途径成员S6Ks、RSKs、PDK1和SGK3的强烈激活。
  4. KRAS的突变导致其下游的细胞外信号调节激酶1/2/5/7(ERK1/2/5/7)的显著激活(图4I)。
  5. 有趣的是,我们发现KRAS突变样本中CAMK2激酶受到抑制,这与先前的研究一致。
  6. 在跨癌症分析中,EGFR突变样本显示出与STK11-和KRAS-突变样本相反的激酶活性模式(补充图S4B)


  • 图S4. 在不同组织和泛癌水平上驱动基因的激酶活性分析,与图4相关 (A) Lolliplot展示了在CPTAC中观察到的EGFR改变情况。棒棒糖图中的数字表示整个队列中具有该改变的肿瘤样本数量。(B) 在多个驱动基因的泛癌水平上进行全面激酶库富集分析景观展示。对于每个激酶和驱动基因,气泡的颜色(log2FF)表示该激酶在突变肿瘤与野生型肿瘤之间的预测频率的log2比率,在泛癌水平上进行比较,而气泡的大小则表示基于Fisher精确检验的统计显著性。(C) 在LUAD中EGFR、KRAS和STK11突变肿瘤与野生型肿瘤相比的全面激酶库富集分析全景。对于每个激酶和驱动基因,气泡的颜色(log2FF)表示该激酶在突变肿瘤与LUAD中的野生型肿瘤之间的预测频率的log2比率,而气泡的大小则表示基于Fisher精确检验的统计显著性。
Para_02
  1. 此外,我们使用激酶库来确定EGFR突变和STK11突变的LUAD样本中不同激酶的活性状态。
  2. 我们发现大多数活化的激酶来自CAMK和AGC家族,而大多数被抑制的激酶则来自CMGC家族,在EGFR突变样本中是这样(图4J)。
  3. 与观察到的整体转效应的负相关一致,对于STK11突变和KRAS突变样本,则观察到了相反的模式,其中CMGC家族主导了活化的激酶,而被抑制的激酶主要是CAMK和AGC家族的成员(图4J)。
  4. 来自不同家族的多个激酶在EGFR突变样本和STK11突变/KRAS突变样本之间显示出了相反的活性(图4K和补充图S4C;补充表S4)。
  5. 这些数据表明EGFR突变和STK11/KRAS突变导致癌症细胞中不同的磷酸化读数。
  6. 我们利用磷酸位点周围的底物基序进行的激酶富集分析可以捕获癌症中驱动突变的基本机制,从而为超出遗传检测之外的治疗策略提供信息。
  7. 这对于篮子临床试验设计和个人化肿瘤药物再利用具有重要意义

Comparative analysis between tumor and normal-adjacent tissue identifies key protein changes for oncogenic pathways

肿瘤与邻近正常组织之间的比较分析确定了致癌途径中关键蛋白质的变化

Para_01
  1. 与其它大规模肿瘤特征研究不同的是,十个CPTAC队列中有八个包含了匹配(相似细胞谱系)或不匹配(非相似细胞谱系)的正常相邻组织(NATs,总数为556),并且胶质母细胞瘤研究还包含了十个基因型-组织表达(GTEx)项目的正常样本(图5A)。
  2. 这使我们能够探究肿瘤与其配对的NAT之间的差异表达模式。
  3. 我们发现肿瘤与它们同源的NAT相比,呈现出独特的蛋白质组学和磷酸化蛋白质组学特征,例如在透明细胞肾细胞癌(ccRCC)中(图5B;补充表S5),并在泛癌队列中鉴定了6,517种在肿瘤中升高的差异表达蛋白(DEPs)以及7,030种在NATs中升高的DEPs。
  4. 在这6,517种DEPs中,有3,070种在≥2种癌症类型中差异表达,其余的则在单一癌症类型中。
  5. 在常见的DEPs中,我们在所有癌症类型中发现了PLOD2、UBE2C和MARCKSL1(图5C;补充表S5)。
  6. 值得注意的是,我们观察到PLOD2蛋白质丰度高显著与透明细胞肾细胞癌(ccRCC)、肺腺癌(LUAD)和胰腺导管腺癌(PDAC)患者的总体生存率较差相关,并且在胶质母细胞瘤(GBM)、头颈鳞状细胞癌(HNSCC)和肺癌鳞状细胞癌(LSCC)患者中也观察到了类似趋势(图5D)。
  7. 这表明PLOD2作为泛癌预后生物标志物的潜在价值。


  • 图5. 分析正常邻近组织识别致癌途径中的关键蛋白变化 (A) 跨癌症类型的肿瘤和正常样本分布。
  • (B) 通过选择性的苏木精-伊红(H&E)染色图像表示的肿瘤与正常组织对比的示意图,这些图像来自ccRCC和UCEC队列的肿瘤与正常配对样本。火山图显示了ccRCC作为例子的差异表达基因(DEGs)和差异表达蛋白(DEPs)。
  • (C) 由肿瘤与NAT比较鉴定出的DEP分布情况。饼状图显示了癌症特异性DEPs与其他DEPs的分布。
  • (D) 表明较高PLOD2蛋白丰度组具有增加生存风险的图表,在多种癌症类型中显示出显著更高的风险比。显示了Cox比例风险模型的P值。须线代表±95%的风险比置信区间。
  • (E) 在八种癌症类型中的七种中,基于细胞周期蛋白的ssGSEA得分在肿瘤中显著高于在NAT中。显示了Wilcoxon秩和检验的P值。⋅P值 > 0.05;∗∗∗P值 < 0.001;以及∗∗∗∗P值 < 0.0001。数据以均值 ± CI表示。
  • (F) 基于激酶库的磷酸化蛋白质组学分析流程,揭示跨癌症类型的肿瘤与正常组织比较中蛋白激酶的不同活性模式。
  • (G) RNA和蛋白质水平上的途径分析(GSEA)。
  • (H) 多种组织中肿瘤与NAT(同源或非同源)比较的激活激酶的激酶库分析。
  • (I) 组织特异性趋势的途径分析(GSEA)和激酶活性分析。参见图S5和表S5。
Para_01
  1. 为了进一步研究肿瘤微环境(TME)中的哪些细胞类型可能表达这些蛋白质,我们使用了单核RNA测序(snRNA-seq)数据,并根据与xCell和ESTIMATE特征的相关性分析,将这些蛋白质分为四类:肿瘤(T)、免疫(I)、间质(S)和混合(M)(图5C和补充图S5A;补充表S5;STAR方法)。
  2. 这使我们能够以更高的分辨率评估TME中的失调特征。
  3. 对各个类别中差异表达蛋白(DEPs)富集的途径进行的分析显示,在T子集中,角质化、EGFR和瓦堡效应等途径被富集;在I子集中,免疫系统和无义介导的mRNA降解(NMD)被富集;在S子集中,细胞外基质(ECM)组织和胶原形成被富集,这反映了TME成分的独特特性(补充表S5)。
  4. 此外,我们观察到微卫星高度不稳定(MSI-high)肿瘤的NMD途径评分显著高于微卫星稳定(MSS)肿瘤(补充图S5B和S5C)。
  5. 据报道,MSI结直肠腺癌(COAD)肿瘤表达了高水平的NMD系统的关键激活因子,并且在体内使用氨来昔诺克斯(amlexanox)抑制NMD可以减少MSI肿瘤的生长。
  6. 这些结果表明,抑制NMD的致癌活性可能为MSI肿瘤的个性化治疗提供额外的治疗途径。
  7. 此外,基于蛋白质的细胞周期ssGSEA评分在七种癌症类型的肿瘤样本中相对于正常相邻组织(NATs)显著升高(图5E)。
  8. 在子宫内膜癌(UCEC)中未发现显著差异,这可能是由于UCEC的NAT主要由肌层组成,其中混有不同程度的子宫内膜,或者因为这些非肿瘤样本来自处于不同月经周期阶段的女性(图5A)。
  9. 在细胞周期途径蛋白中,我们在多种癌症类型中发现了27个上调的DEPs(图5E)。
  10. 同样地,我们检测到跨癌症类型,与NATs相比,肿瘤中TP53调控的转录途径始终富集(补充图S5D)。
  11. 至于特定癌症类型中评价的DEPs,它们对某些途径如UCEC中的脂质代谢和头颈鳞状细胞癌(HNSCC)中的角质化有所贡献(补充图S5E)


  • 图S5. 对正常邻近组织的分析确定了与致癌途径相关的关键蛋白质变化,与图5相关 (A) 免疫系统和细胞外基质组织的小样本基因集富集分析(ssGSEA)得分与来自ESTIMATE的免疫评分及间质评分显示出统计学上的显著皮尔逊相关性。显示了相关性检验的p值,r代表皮尔逊相关系数。
  • (B)通过箱线图展示了每种癌症类型中微卫星不稳定性(MSI)类别的分布,图中的颜色区分微卫星稳定(MSS)与微卫星高度不稳定(MSI-high)类别。箱子代表四分位间距(IQR,例如,中位数、0.25和0.75四分位数),须代表最大值和最小值,这些值位于1.5倍IQR范围内。
  • (C)无义介导的mRNA降解ssGSEA途径得分在MSI-high组中富集,其次是MSS组。获得了威科森符号秩检验p值为9.6e-06。
  • (D)基于蛋白质的TP53转录调控ssGSEA得分在所有八种癌症类型的肿瘤中显著高于相应的正常邻近组织(NATs),以及在胶质母细胞瘤(GBM)与GTEx正常样本相比时也是如此。显示了威科森符号秩检验p值。在小提琴图中,点代表均值,实线表示由95%置信区间定义的误差限。小提琴图轮廓展示了核概率。
  • (E)根据仅在相应癌症类型中检测到的差异表达蛋白(DEPs),不同癌症类型中富集的不同途径。获得了经过超几何检验的假发现率(FDR)校正p值。
  • (F)基于激酶库,比较肿瘤与其对应的正常邻近组织,在八种癌症类型中激酶活性的全景图。对于每个激酶和肿瘤类型,气泡的颜色(log2FF)表示该激酶在肿瘤与其对应的正常邻近组织之间的预测频率的对数比,气泡的大小表示基于费舍精确检验的统计显著性。
Para_01
  1. 最后,我们利用激酶库从我们的磷酸化蛋白质组学数据推断不同癌症中的激酶活性模式(图5F;STAR方法)。
  2. 我们首先应用基于蛋白和RNA的途径富集分析来表征跨组织间的共有或特异性的途径。
  3. 有趣的是,细胞周期和其他复制相关途径在大多数肿瘤类型中被富集,主要仅在蛋白水平上(图5G;补充表S5)。
  4. 激酶库显示,在大多数肿瘤类型中多种CDK广泛激活,除了ccRCC和PDAC(图5H)。
  5. 拼接途径也在各种组织的蛋白水平上主要被观察到(图5G),这与相应组织中激活的拼接激酶一致(图5H)。
  6. 此外,我们在不同组织中的激酶活性与其相关的蛋白水平上的富集途径之间找到了一致性,例如PI3K-AKT-mTOR途径仅在ccRCC中被富集(图5I;补充表S5)。
  7. 此外,我们观察到了PDAC中KRAS信号传导可能存在的反馈机制,这种机制仅在磷酸化水平上显现出来,其中KRAS信号传导上调与ERK家族蛋白激酶活性降低相关。
  8. 这一见解可能解释了治疗性药物在KRAS突变胰腺肿瘤中的临床效果不佳,并进一步强调了癌症的蛋白质组学和磷酸化蛋白质组学特征描述的重要性(图S5F)。
  9. 参考文献50未在翻译中体现。

Impact of somatic mutations on immunogenic neoantigens and druggable kinases

体细胞突变对免疫原性新抗原和可药物靶向激酶的影响

Para_01
  1. 鉴于新抗原与免疫疗法的相关性,我们系统地预测了结合患者特异性人类白细胞抗原(HLA)I类等位基因的新抗原(详细方法见 STAR 方法部分)。
  2. 我们发现了新抗原负担与肿瘤突变负担之间的预期正相关关系,并且在具有吸烟和微卫星不稳定性(MSI)突变特征的肿瘤样本中观察到更高的新抗原负担。
  3. 根据突变负担标准化后预测的新抗原负担对于高度微卫星不稳定(MSI-High)样本更高,这可能是因为插入和缺失导致的框移突变频率较高。
  4. 新抗原负担与推断出的T细胞浸润呈正相关(p 值 = 4e-4,细胞毒性T淋巴细胞(CTL)评分;p 值 = 0.002,CIBERSORTx CD8 T 细胞;Wald 检验),在泛癌症水平上是这样。
  5. 然而,只有那些倾向于具有较高基础肿瘤突变负担的癌症类型(结直肠腺癌(COAD)、子宫内膜癌(UCEC)、肺腺癌(LUAD)和乳腺癌(BRCA))单独显著,这表明可能存在免疫原性的最小新抗原负担阈值。


  • 图6. 突变体的免疫原性和药物可及性分析 (A) 肿瘤中的突变数量与新抗原负担之间的皮尔逊相关性,按突变特征(吸烟特征权重)或DNA修复缺陷(POLE, POLE突变;MMRD, 错配修复缺陷)分层。 (B) 新抗原负担与细胞毒性T淋巴细胞(CTL)评分之间的皮尔逊相关性,根据LUAD中KRAS的驱动突变状态分层。显示了Wald检验p值。 (C) 散点图表明具有更多预测新抗原的同时存在于高表达蛋白质中的基因。虚线表示>1蛋白质丰度(y轴)和>20新抗原(x轴)。 (D) 热图显示了基于不同蛋白质丰度子集的CTL评分与新抗原负担之间的斯皮尔曼相关性。 (E) 盒图表明两个可药物靶标的CNAs对蛋白质水平的顺式效应。显示了Wilcoxon秩和检验p值,数据表示为中位数和四分位间距。 (F) 在泛癌症水平上不同CNAs下的激酶活性。对于每个激酶和条件,气泡的颜色(log2FF)表示该激酶在具有CNAs的肿瘤与野生型肿瘤之间预测频率的log2比率,而气泡大小表示Fisher精确检验的统计显著性。 (G) 上部,火山图显示含有致癌RB1-变异的肿瘤的差异表达基因(DEGs)。绿色点表示细胞周期相关基因(CDK1-6)。下部,热图显示了细胞周期相关基因在RNA和蛋白质水平上的差异表达(Wald检验)。正t统计量(红色)表示上调;负t统计量(蓝色)表示下调。 (H) 热图显示了蛋白丰度特征(源自驱动变异)与CMAP LINCS 2020数据集中药物反应特征之间的标准化药物连接分数。负连接分数(蓝色)表示特征对特定药物的预测敏感性。 (I) 七种CDK抑制剂在L1000试验中与泛癌症(顶部)和癌症特异性(底部)驱动变异特征之间的平均药物连接。使用激酶库推断CDK激活状态。 (J) 上部,箱形图显示了两种基因(CDK2和CDK6)从CRISPR敲除筛选(DepMap)的癌症细胞系依赖性,取决于RB1基因中是否存在pLOF突变。显示了Wilcoxon秩和检验p值,数据表示为中位数和四分位间距。下部,热图显示了细胞周期相关基因(CDK1-6)的差异基因依赖性(t统计量,Wald检验)。另见图S6和表S6。
  • 图S6. 新抗原负担、激酶活性和药物敏感性的分析,与图6相关 (A) 左侧,小提琴图显示微卫星稳定(MSS)与微卫星高度不稳定(MSI-high)肿瘤中体细胞突变插入缺失的比例分布。右侧,预测的新抗原数量对比单核苷酸变异(SNV),展示了累积数量。显示了Wilcoxon符号秩检验的p值。∗∗∗∗p值 < 0.0001。在小提琴图中,点表示平均值,实线表示由95%置信区间定义的误差极限。小提琴图轮廓展示了核概率。
  • (B)左侧,细胞毒性T淋巴细胞(CTL)评分与对数转换后的新抗原负担的相关性。p值反映了调整癌症类型作为协变量后的Wald检验。阴影区域代表95%的置信区间(左侧);右侧,来自CIBERSORT(绝对值)的CD8 T细胞评分与对数转换后的新抗原负担的相关性。p值反映了调整癌症类型作为协变量后的Wald检验。阴影区域代表95%的置信区间。
  • (C)不同RNA水平表达基因的新抗原负担与推断的T细胞浸润(CTL评分)之间的皮尔逊相关系数。
  • (D)拷贝数扩增对RNA、蛋白质及磷酸化水平的顺式效应。红色表示表达增加,蓝色表示表达减少。瓷砖颜色根据顺式效应得分从红色(正向得分)到蓝色(负向得分)进行着色。带符号的log10(p),将系数的方向乘以调整后的p值的log10(上限为±10)。
  • (E)箱形图比较了具有扩增(原癌基因)或缺失(肿瘤抑制因子)的蛋白质与野生型肿瘤相比的表达变异性。每个点代表特定原癌基因/肿瘤抑制因子的蛋白质丰度的标准差。显示了Wilcoxon符号秩检验的p值。箱子代表四分位间距(IQR,例如,中位数,0.25和0.75四分位数),须触表示最大和最小值在1.5 × IQR范围内的值。
  • (F)全景观展示了跨泛癌症水平多种拷贝数异常(CNAs)的激酶库富集结果。对于每个激酶和驱动因素,气泡的颜色(log2FF)表示该激酶在带有CNA的肿瘤与泛癌症水平上的野生型肿瘤之间预测频率的对数比率,而气泡大小表示基于Fisher精确检验的统计显著性。
  • (G)三个先前研究中RB1染色质免疫沉淀(ChIP)测序的CDK2位点的基因组轨迹。归一化覆盖意味着每百万读取次数。
  • (H)热图评分RB1 ChIP-seq峰与细胞周期相关基因(CDK1-6,周期素A-E)的距离。潜在调控评分考虑了ChIP-seq峰的数量和接近基因转录起始位点的程度。对每个数据集进行了标准化,因此最大值为1。
  • (I)火山图显示了DepMap的CRISPR敲除筛选中RB1改变的细胞系中差异依赖的基因。效应大小是用于统计测试的线性回归模型中的beta系数。绿色点表示细胞周期相关基因(CDK1-6,周期素A-E)。
Para_01
  1. 为了探究预测的新抗原负担与T细胞浸润之间在特定驱动突变背景下的关系,我们采用了一种交互项回归模型(见星号方法部分)。
  2. 七个驱动基因中的致癌变异与新抗原负担和推断出的T细胞浸润之间的相关性变化有关,其中包括KRAS(q值<0.1;图6B;补充表S6)。
  3. 为了探究新抗原表达水平与免疫原性之间的潜在关联,我们观察到,在微卫星不稳定性高的肿瘤样本中,一部分含有较多预测新抗原(≥20)的基因在蛋白质水平上也高度表达(蛋白质丰度>1)(图6C)。
  4. 在蛋白质高度表达的蛋白质与所有蛋白质的新抗原负担方面,与推断出的T细胞浸润的相关性有所提高(q值=0.03,似然比检验,图6D),这在微卫星不稳定性常见的结直肠腺癌中尤为明显。
  5. 值得注意的是,对于高度表达的转录本与所有转录本的新抗原负担,并没有改善相关性(补充图S6B),这凸显了蛋白质组学的优势。
Para_02
  1. 尽管与野生型肿瘤相比,致癌基因的拷贝数扩增与更高的蛋白质丰度相关,正如预期的那样(图S6C),但它们在蛋白质丰度上也显示出更高的变异(P值=0.006,Mann-Whitney U检验,图S6D;表S6)。
  2. 这些发现扩展到了可药物干预的目标(图6E)。
  3. EGFR和ERBB2扩增的肿瘤比其野生型对照具有更高的蛋白质丰度(P值分别为4e-16和5e-9)。
  4. 然而,在蛋白质丰度分布上仍然存在相当大的重叠(图6E),因为区分ERBB2和EGFR扩增与野生型肿瘤的平均精确度仅为0.53和0.37(满分1.0)。
  5. 蛋白质丰度可能为治疗决策提供了超越单独基因组事件之外的额外信息。
  6. 由于可直接靶向的致癌基因数量有限,分析拷贝数异常的跨效应可能会进一步扩大潜在可药物干预的目标。
  7. 利用激酶库,我们分析了可能激活可药物干预的激酶的拷贝数异常事件(图S6E)。
  8. 我们发现多种拷贝数异常事件导致CDKs的激活(图6F;表S6),包括CDKN2A的缺失,这之前在实验和临床研究中作为CDK4/6抑制剂治疗的潜在生物标志物得到了支持。
  9. 除CDKN2A缺失外,我们在核心细胞周期通路内及以外发现了与CDK激活相关的其他拷贝数异常事件(图6F和图S6E)。
  10. RB1发生致癌改变的肿瘤在RNA和蛋白质水平上均与CDK2的显著上调有关(图6G;表S6),这可能与RB1丢失及其已知的转录抑制作用有关(图S6F和S6G)。
  11. 相比之下,RB1改变的肿瘤也在RNA和蛋白质水平上表现出CDK6的显著下调(图6G)。
  12. 因此,来自激酶库的CDK激活信号可能反映了根据驱动性改变激活不同的CDK。
Para_03
  1. 为了区分CDK活化代表癌症依赖的情形,我们通过分析细胞系药物反应数据以及驱动突变的蛋白质组学特征(包括体细胞突变和染色体拷贝数异常)来扩展潜在治疗脆弱性的分析。
  2. 我们计算了64种驱动突变的蛋白质组学特征与药物反应特征之间的标准化药物连接得分(涉及的药物要么已获得FDA批准,要么正处于临床研究阶段;CMAP的综合网络基础细胞特征[LINCS]数据库)。
  3. 有趣的是,与激酶库的结果一致(图6F、补充图S5C和S6F),我们发现泛癌蛋白质组学特征与细胞周期通路内外的基因相关,这些特征与多种CDK抑制剂(CDKi)具有药物连接性(图6H,顶部)。
  4. 这些发现同样适用于特定组织的驱动突变蛋白质组学特征(图6H,底部)。
Para_04
  1. 在某些情况下,例如RB1缺失,激酶库中观察到了强烈的CDK激活,但与CDKi药物反应谱的关联相对较弱(图6I)。
  2. 这可能与RB1突变在对CDK4/6i(如帕博西利)的原发性和获得性耐药中的已知作用有关。
  3. 与此一致的是,通过分析CRISPR基因敲除筛选(DepMap)发现,RB1改变的癌细胞系对CDK4/6的依赖性较低,而对CDK2的依赖性较高(q值<0.1,Wald检验;图6J、补充图S6H和S6I;补充表S6)。
  4. 尽管未被纳入CMAP,最近开发的选择性针对CDK2的小分子可能对RB1改变的肿瘤更为有效。
  5. 总体而言,大多数在激酶库中显示出CDK激活的驱动性变异体使用独立的蛋白质组学特征与CDKi表现出高(负向)药物相关性(图6I)。
  6. 这些结果表明,对于携带不一定直接与细胞周期途径相关的基因组变异(如MCL1或ERBB2扩增)的肿瘤,CDKi治疗可能具有潜在的疗效益处。

Integrative multi-genomic scoring provides evidence on how somatic alterations alter cancer hallmarks

整合多基因组评分提供了关于体细胞改变如何改变癌症特征的证据

Para_01
  1. 单个基因改变可以在顺式、反式及中介设置中影响蛋白质组学景观。
  2. 然而,我们希望探索所有体细胞突变对癌症类型内整体蛋白质变异性的全局影响。
  3. 为了解决这个问题,我们构建了一个用于肿瘤学的综合多基因蛋白质丰度预测算法,称为C3PO,作为理论练习。
  4. 该工具应用多基因数学方法来描述蛋白质变异性,而不是疾病状态,就像多基因风险评分(PRS)一样。
  5. 为了计算一个多基因预测因子,需测量在改变或未改变状态下蛋白质丰度的变化。
  6. 可以将多个改变的影响大小相加,从而产生基于存在哪些改变的多基因风险评分。
  7. PRS的典型应用通过比较突变样本与非突变样本来生成影响大小,针对感兴趣的表型。
  8. 然而,由于癌症中罕见突变驱动基因的数量庞大,我们将突变聚集到嵌套蛋白系统中。
  9. 这样做提供了对可能的突变对蛋白质影响更广泛的覆盖。
  10. C3PO的结果表明,仅体细胞突变和拷贝数事件平均解释了这十种癌症类型中蛋白质丰度变异性的7.2%至27.5%(范围从0%到91.9%)。
  11. 当应用于一个正交数据集时,C3PO只能总体上解释HGSC中全球蛋白质变异性的0.7%至2.6%。
  12. 对于BRCA,C3PO可以解释2.0%的拷贝数扩增,2.0%的拷贝数缺失以及2.3%的体细胞突变(范围从0%到31.2%)。
  13. 而对于COAD,它可以解释2.2%的拷贝数扩增,2.0%的拷贝数缺失以及2.6%的体细胞突变(范围从0%到38.8%)。
  14. 我们相关性的进一步分析显示,结合底物得分可以提高预测准确性。
  15. 这个平均范围(0.7%至27.5%)代表了我们的工具的累积上限(过拟合)和下限(未优化),并提示需要采用蛋白质组学测量来更好地理解突变事件的后果。


  • 图S7. C3PO概述及其在正交数据集中的性能,与图7相关 (A) C3PO流程的概述包括以下步骤:(1) 我们采用嵌套基因关系架构来分类改变和未改变的基因。我们这样做是为了改进癌症中改变基因的长尾分布;(2) 使用Cohen’s D统计量作为每个改变的巢群和基质效应大小的代理;(3) 对每个基因组基质(DNA、拷贝数扩增和拷贝数缺失)计算效应大小矩阵;(4) 我们在这个过程中验证了多个独立队列[癌症细胞系百科全书(CCLE)和癌症基因组图谱(TCGA)];(5) 圆圈展示了我们将蛋白质活性转化为标志水平分数的方式。圆圈内的方程表示用于生成各种分数的组合多基因方程。
  • B部分 C3PO蛋白质活性分数与CPTAC中测量的所有蛋白质相关联。展示的是归因于每个基质的相关系数分布:DNA(蓝色)、拷贝数扩增(AMP,粉红色)和拷贝数缺失(DEL,绿色),针对每种癌症类型,包括聚合泛癌训练预测。垂直的红色条形表示零相关。
  • C部分 结合的C3PO蛋白质活性分数也进行了计算,并与测量的蛋白质相关联。每种癌症类型的关联系数分布,包括泛癌训练预测被呈现。垂直的红色条形表示零相关。
  • D部分 类似于B部分,C3PO加权活性矩阵应用于两个正交数据集,CPTAC回顾性样本(TCGA)和350个癌症细胞系百科全书(CCLE)样本,涉及三种癌症类型:卵巢癌(HGSC)、乳腺癌(BRCA)和结直肠肿瘤(COAD)。类似于B部分,预测的蛋白质活性与测量的蛋白质相关联。垂直的红色条形表示零相关。
  • E部分 类似于C部分,结合的蛋白质活性预测与测量的蛋白质相关联。垂直的红色条形表示零相关。
  • F部分 使用QQ图展示了所有来自(D)和(E)部分中皮尔逊相关产生的p值,针对卵巢样本。每个基质的QQ图被绘制(DNA,左上角;拷贝数扩增,右上角;拷贝数缺失,左下角;以及组合分数,右下角)。膨胀的p值被解释为C3PO能够准确预测蛋白质活性超过预期的p值分布的能力,对于执行的测试数量而言。因此,p值膨胀越高,C3PO预测在识别基因组改变与蛋白质活性之间的相关性方面就越准确。Lambda提供了膨胀值。Lambda(λ)值衡量超出预期分布的p值分布。
  • G部分 类似于(F)部分。为乳腺癌的每个基质提供了QQ图和Lambda值。
  • H部分 循环图显示了每种癌症类型的21种癌症标志途径。图标表示与Hanahan和Weinberg66最初概述的原始标志的关系。CPTAC中的每个样本由连接标志的链接表示,并根据癌症类型着色。每个样本根据ssGSEA生成的前两个标志活动分数使用一条线来表示。
  • I部分 循环图显示了每种癌症类型的21种癌症标志途径。图标表示与Hanahan和Weinberg66最初概述的原始标志的关系。CPTAC中的每个样本由连接标志的链接表示,并根据癌症类型着色。每个样本根据C3PO生成的前三个标志活动分数使用三条线来表示。
Para_01
  1. 虽然可能难以预测单个蛋白质,但在途径中的许多蛋白质上出现的一致变化可能会揭示出生物学上的有意义的结果。
  2. 为了说明这一点,我们汇集了C3PO在癌症标志基因上的评分66,67(图7A、7B和S7I;表S7;STAR方法)。
  3. C3PO设计用于评估肿瘤间的变异性。
  4. 因此,几乎所有肿瘤都显示出途径失调的情况,例如大约95%的胰腺导管腺癌为KRAS突变体,并不在这个分析中被捕捉到。
  5. 我们通过评估C3PO为每个样本产生的前三个标志评分中的熵来探索由基因组变异导致的癌症类型间标志变异(图7C)。
  6. 从这些预测中,我们发现某些癌症类型的标志变异较低(图7D),而其他类型则较高(图7E)。
  7. 例如,在肺腺癌中,适应性免疫和DNA修复的C3PO标志评分一直很高,且在染色质修饰途径中有更高的吸烟评分68(卡方检验p值 = 3.8 × 10-7)(图7D;STAR方法)。
  8. 相比之下,子宫内膜癌每一样本的顶级标志表现出显著更多的异质性(图7E),包括DNA修复和一些途径,如NOTCH,这些在肺腺癌中并未观察到。
  9. 因此,我们目前对基因组学数据的系统理解至少可以捕捉到癌症标志蛋白水平的一些变异。


  • 图7. C3PO工具用于探究多基因组对癌症内表型的影响 (A) C3PO概述。左侧显示了基因组改变对蛋白质水平的理论贡献(包括拷贝数变异和突变);右侧提供了仅从蛋白质角度审视癌症标志。
  • (B)Circos图展示了21条癌症标志通路。图标表示与Hanahan和Weinberg最初提出的标志之间的关系。66,67 CPTAC中的每个样本通过连接标志的链接表示,并根据癌症类型着色。
  • 每个样本根据由C3PO生成的前三个标志活动得分使用三条线展示。直方图显示了C3PO标志得分的分布。
  • (C)采用香农熵量化每种癌症类型的前三个标志之间的多样性。每根条形代表每个样本和癌症类型的前三个标志的排名熵。
  • 癌症按其样本顶级标志的最低熵测量值排序。
  • (D)热图展示了LUAD样本及其对于21个标志的C3PO标志得分。行和列采用无监督聚类进行排序。底部注释包括新抗原计数估计、总突变计数和吸烟评分。
  • (E)类似于图7D,展示了UCEC样本。
  • (F)类似于图7B,每个样本用一条线表示,该线链接由ssGSEA产生的前两个标志得分。
  • (G)类似于图7C,基于ssGSEA得分进行了香农熵计算。
  • (H-I)类似于图7D和7E,但展示了由ssGSEA生成的得分。还请参见补充图S7和补充表S7。
Para_01
  1. 除了C3PO产生的特征得分外,我们还使用了一种已建立的通路富集工具ssGSEA,直接从蛋白质丰度识别富集情况(图7A和7F;表S7;STAR方法)。
  2. 我们在每份样本的顶级特征中观察到了更高的通路变异性(图7G)。
  3. 在所有LUAD中,DNA修复、细胞周期和凋亡以及与C3PO共享的癌症驱动因素的特征显示出相似的统一性,但许多其他特征显示出了更大的多样性(图S7H)。
  4. 类似地,对于C3PO和ssGSEA而言,DNA修复、细胞周期和凋亡、染色质修饰及癌症驱动因素的特征聚集在一起,但ssGSEA更广泛地代表了剩余的特征。
  5. 进一步分析发现,LUAD(图7H)和UCEC(图7I)均包含具有更高EMT和ECM活性的样本亚组——这是一种通常不与已知驱动事件相关的特征(分别为19个和21个样本)。
  6. 这些亚组中差异表达最显著的蛋白质为UCEC中的VPS13A、FSTL1和TMEM30B(p值分别为5.1×10-7、2.6×10-5和6.3×10-5;双侧t检验)以及LUAD中的SLPI、TSPAN1和CALD1(p值分别为1.6×10-5、2.6×10-5和4.4×10-5;双侧t检验)。
  7. 这一结果仅基于我们从ssGSEA获得的蛋白质分析,表明肿瘤内的蛋白质变异性可以反映不同水平上的DNA、RNA和蛋白质改变的累积效应。
  8. 这些改变可能产生类似的下游影响,并且独立于体细胞变异,这可能是由于细胞外或微环境相互作用所致。
  9. 这些发现补充了基因组学研究,并突显了蛋白质组学对肿瘤表型特征描述的贡献。

Discussion

Para_01
  1. 通过高通量基因组分析加速发现和功能表征致癌驱动因素,推动了我们对致癌机制的理解,并带来了更有效的治疗方法。
  2. 最初,靶向治疗仅限于特定类型的肿瘤。
  3. 然而,不同癌症中发现的共享且可治疗的驱动因素导致了美国食品药品监督管理局批准了一些不针对特定肿瘤类型的药物。
  4. 随后,美国食品药品监督管理局批准了广泛的基因面板测试,以揭示具有临床意义的变异体,其中特定的改变与靶向治疗相匹配。
  5. 这些进展激发了对泛癌症驱动因素分子基础的分析。
  6. TCGA泛癌症图谱代表了一个整合多种肿瘤类型分子基因组数据的初步框架,提供了新的见解。
  7. 这也突显了需要扩大对驱动变异的功能、机制和表型相关性在更多层面上的分子数据进行表征的需求
Para_02
  1. 在这里,我们利用了来自十种癌症类型的蛋白质组和磷酸化蛋白质组的数据,并结合基因组和转录组数据,评估了CPTAC队列中5,443种潜在驱动变异在整个癌症范围内的后果。
  2. 我们的蛋白质基因组学分析提供了对致癌突变分子机制的见解,从单个蛋白质到癌症标志,揭示了潜在的新治疗途径。
  3. 为了精确解析癌症蛋白质组是如何形成的,我们分析了致癌变异在不同生物调节层面上的影响,从对同一蛋白(顺效应)的影响开始,扩展到蛋白质相互作用和复合体,直至整个(磷酸化)蛋白质组,包括横效应和多基因预测框架。
  4. 为了评估癌症中蛋白质-蛋白质相互作用(PPI)的重排,我们使用蛋白质共表达数据作为PPI的间接读数。
  5. 我们发现了因癌症类型或驱动变异而不同的候选PPI。
  6. 有趣的是,许多驱动因子被发现其驱动变异发生在已知相互作用蛋白质之间的界面上,包括PIK3R1-PIK3CA、SMAD4-SMAD2和PPP2R1A-PPP2R2A。
  7. 重要的是,使用RNA数据进行的类似分析仅揭示了一部分在蛋白质水平上检测到的PPI效应,这凸显了蛋白质组学分析的重要性。
  8. 鉴于网络医学的新兴作用,我们相信利用泛癌症蛋白质组学数据将突变与PPI网络间接关联起来的做法将会带来启示。
Para_03
  1. 我们利用驱动事件的横向效应发现,途径中的不同癌症基因往往表现出相似的分子特征。
  2. 这表明它们的分子效应是相似的,例如 NFE2L2 和 KEAP1,以及 KMT2B 和 CREBBP。
  3. 这种分子聚合解释了相当一部分致癌驱动因子之间的相互排斥现象。
  4. 然而,我们也发现了一些案例,其中分子特征呈现出负相关性,这些通常与相互排斥的驱动基因重叠,比如 EGFR 和 STK11、CDH1 和 TP53 或 EGFR 和 KRAS。
  5. 可以设想,这些基因对之所以相互排斥是因为其中一个基因发生突变会使细胞趋向于一种状态,在这种状态下另一个基因的突变与致癌过程不相容(还有其他可能的解释)。
  6. 这些基因(EGFR 和 STK11)是分歧不兼容而不是致癌聚合和冗余的。
  7. 这些分歧不兼容可能代表了合成致死性的脆弱点,正如在肺癌中 EGFR 和 KRAS 所显示的那样。
  8. 利用这一现象激活分歧不兼容基因的药物值得考虑。
  9. 因此,来自激酶库的结果,展示了 EGFR 突变和 STK11/KRAS 突变肿瘤如何激活相反的激酶集合,可能会提供这样的药物靶点。
Para_04
  1. 为了研究肿瘤基因组变异对蛋白质组累积影响,我们构建了C3PO,一个多基因预测框架,该框架经过训练能够预测蛋白质丰度。
  2. 目前,预测能力仅限于大约27%的全球蛋白质组景观,这可能是因为细胞可塑性以及由肿瘤微环境引起的转录组波动。
  3. 然而,这一工具使我们能够在空间和时间上评估基因组对肿瘤中蛋白质标志变异的贡献。
Para_05
  1. 总之,本研究强调了蛋白质组学提供的关键见解,用于系统评估致癌驱动因素对癌症功能状态的影响。
  2. 今后,更广泛的表征蛋白质的翻译后修饰和代谢组可以进一步揭示驱动突变如何干扰E3泛素连接酶等蛋白质的活性。
  3. 此外,通过应用单细胞蛋白质组学、空间蛋白质组学以及每位患者的多个肿瘤内/间样本,可以更全面地阐明蛋白质组对肿瘤异质性和与肿瘤微环境相互作用的贡献。
  4. 最后,将蛋白质组学与治疗前和治疗后的样本相结合的临床试验可能会揭示对治疗反应和抗性的决定因素,并为组合疗法提供信息,这些信息更直接地与药物的作用相关:蛋白质组。
  5. 这可能导致临床上可实施的蛋白质基因组面板的开发。
  6. 我们的发现支持蛋白质组作为致癌驱动因素的基因型与其功能状态之间的缺失环节的观点。

Limitations of the study

研究的局限性

Para_06
  1. 这项泛癌症蛋白质基因组学研究包含了之前作为CPTAC联盟旗舰研究分别分析过的十种肿瘤类型。
  2. 这一队列高度多样化,包括三种特定于女性的癌症,即乳腺癌、高级别浆液性卵巢癌和子宫内膜癌,但不包括最常见的男性癌症——前列腺腺癌。
  3. 此外,胶质母细胞瘤代表了一种相对较少见且生物学特性与队列中其他肿瘤更为不同的肿瘤类型。
  4. 计划中的额外队列将改善这一组成上的局限。
  5. 本研究中的一些肿瘤具有相应的正常相邻组织,这些组织由与癌症密切相关的细胞谱系组成。
  6. 对于其他一些肿瘤,则没有这样的正常相邻组织。
  7. 对药物敏感性的泛癌症分析似乎聚焦于与细胞周期相关的蛋白质,这很大程度上是出于社区对靶向癌症这一核心特征进行治疗的兴趣。
  8. 尽管发现激酶在肿瘤中活性升高可能表明潜在的药物靶点,但仍需仔细考虑该激酶在正常组织中的必需性,以便确定可能的治疗窗口。
  9. 然而,泛癌症蛋白质组学对其他标志表型的读数可能仍具有治疗指导意义,并值得在未来的研究中进行深入评估。

Consortia

Para_01
  1. 国家癌症研究所临床蛋白质组肿瘤分析联盟的成员包括弗朗索瓦·阿盖特、约·阿基亚马、尹坤庆、尚卡拉·阿南德、米纳克希·阿努拉格、奥兹根·巴布尔、贾斯敏·巴瓦尔瓦、切特·比尔杰、迈克尔·J·比里尔、安娜·卡利纳万、刘易斯·C·坎特利、曹松、史蒂文·A·卡尔、米歇尔·切卡雷利、丹尼尔·W·陈、阿鲁尔·M·钦奈安、乔·汉拜尔、肖拉班提·乔杜里、马尔辛·P·采斯利克、卡尔·R·克劳泽、安东尼奥·科拉皮科、周丹尼尔·崔、费利佩·达·维加·莱普罗沃斯特、科宾·戴、萨拉瓦纳·M·丹纳塞卡兰、李丁、马尔辛·J·多马加尔斯基、董永超、布莱恩·J·德鲁克、内森·爱德华兹、马修·J·埃利斯、米维齐·埃赛尔·塞万、大卫·芬约、史蒂文·M·福尔茨、艾丽西亚·弗朗西斯、伊法特·盖芬、加德·盖茨、迈克尔·A·吉利特、塔尼亚·J·冈萨雷斯·罗布尔斯、萨拉·J·C·戈斯林、泽耶内普·H·古穆斯、大卫·I·海曼、塔拉·希尔特克、洪润宇、盖伦·霍斯特特、胡英伟、黄晨、亨特曼·艾米莉、安东尼奥·伊瓦罗内、埃里克·J·詹宁、斯科特·D·朱厄尔、贾伊伊·吉、温·江、贾里德·L·约翰逊、利莎白·卡茨内尔松、凯伦·A·凯奇姆、伊加·科洛德热伊恰克、卡尔斯特恩·克鲁格、钱丹·库马尔-辛哈、亚历山大·J·拉扎尔、乔纳森·T·莱伊、李义泽、梁文蔚、廖玉兴、凯勒布·M·林德格伦、刘涛、刘文克、马卫平、D·R·马尼、费尔南达·马丁斯·罗德里格斯、威尔逊·麦克斯罗威、梅赫迪·梅斯里、阿列克谢·I·涅斯维日斯基、切尔西·J·纽顿、罗伯特·奥尔德罗伊德、吉尔伯特·S·奥门、阿曼达·G·保罗维奇、塞缪尔·H·佩恩、弗朗切斯卡·彼得拉利亚、彼得罗·普格利泽、鲍里斯·雷瓦、安娜·I·罗布尔斯、卡琳·D·罗德兰、亨利·罗德里格斯、凯利·V·拉格尔斯、德米特里·里昆诺夫、尚卡·萨特帕西、萨拉·R·萨维奇、埃里克·E·施达特、迈克尔·施瑙贝尔特、托比亚斯·施赖尼克、斯特凡·舒尔、石志佼、理查德·D·史密斯、宋晓宇、宋宜哲、瓦西莱奥斯·斯塔西亚斯、埃里克·P·斯托尔斯、谭吉明、娜杰日达·V·特雷哈诺娃、拉特纳·R·唐古杜、马塔吉·蒂亚加拉詹、妮科尔·蒂格诺、约书亚·M·王、王亮博、王沛、王颖、文博、麦克凯伊·维兹纳维奇、吴一格、马修·A·维查考斯基、姚立俊、托默·M·亚龙、易欣培、张冰、张辉、张青、张旭、张臻。
  2. 以上成员致力于泛癌症研究。

Additional resources

附加资源

Para_01
  1. 关于CPTAC项目的综合信息,包括项目举措、研究者和数据集,均可在CPTAC项目网站上获取:https://proteomics.cancer.gov/programs/cptac
Para_02
  1. 对于泛癌症蛋白质基因组学收集论文,以及与这些出版物相关的数据和补充材料的链接,请访问蛋白质组数据公共库(PDC)网站https://pdc.cancer.gov/pdc/cptac-pancancer

本文由mdnice多平台发布

上一篇下一篇

猜你喜欢

热点阅读