2019年8月week 1 Cell 追踪肺腺癌突变历史中的癌基
Tracing Oncogene Rearrangements in the Mutational History of Lung Adenocarcinoma
全文链接
Published:May 30, 2019
DOI:https://doi.org/10.1016/j.cell.2019.05.013
总结
通过对138个LADC样本的全基因组测序数据进行分析,发现基因组重排驱动smoking-signature-low LADCs的形成;chromothripsis(染色体碎裂)、chromoplexy(一种复杂重排)等复杂的基因组重排产生74%的已知融合癌基因,提出融合癌基因和点突变在肿瘤发生早期就已产生,揭示出内源性的突变过程驱动了LADC肿瘤形成。
Highlights
• LADC中的驱动融合癌基因由复杂的基因组重排产生
• 这些重排通常是拷贝数平衡,类似于种系事件
• 融合通常在早期出现,有长时间的诊断延迟
• SETD2失活与TP53-野生型LADC中的融合癌基因有协同作用
Summary
非吸烟者发生肺腺癌(LADCs)的突变过程尚不清楚。我们分析了138例LADC的全基因组,其中83例与吸烟相关突变特征的关系甚微。基因组重排与吸烟相关的突变无关,常常作为与吸烟相关度低的LADCs的驱动事件。复杂的基因组重排产生了74%的已知癌基因融合,包括EML4-ALK、CD74-ROS1和KIF5B- RET等。
与其他附带性重排不同,这些与融合癌基因相关的重排常常是拷贝数均衡的,这体现了早期肿瘤发生的一个基因组特征。通过分析突变产生的时间,研究人员发现经典癌基因的融合和点突变通常发生在青幼年时期。经过较长的潜伏期,癌症相关基因被复杂的重排破坏或放大。
不同的LADC亚群间的基因组并不同——EGFR突变的LADC带有较高频率全基因组倍增以及p53突变;而癌基因融合导致的LADC里则拥有较高频率的SETD2突变。我们的研究提示内源性突变的积累过程能够驱使肺腺癌的产生。
Results
研究人员对138例LADCs进行全基因组测序分析,发现高置信度体细胞突变,包括4136995个碱基替换和186170个插入突变;21420个体细胞基因重组,其中77%由893类复杂基因重组导致。基于COSMIC标准分析LADC的突变特性(mutational signatures),并分成signature 4-high(S4-high)(55个),signature 4-low(S4-low)(83个)两类。
S4-high LADCs显示出诊断年龄更大、男性比例更高、KRAS突变更多、>10次的碱基替换更多等特点。S4-low LADCs则细分为癌基因突变、融合癌基因及未知融合癌基因组。
Figure 1
图1肺腺癌的进程
(A)研究队列的组成和LADC分组为亚组。
(B)K均值聚类将患者群组(n = 138)分离成S4高(n = 55)和S4低(n = 83)LADC(STAR方法)。
(C和D)S4-高(C)和S4-低(D)LADC的代表性突变光谱,由96-三核苷酸环境中突变部分的中值计算。
(E)本研究中LADCs的临床,人口统计学和基因组特征。 从聚类定义复杂的基因组重排,并且通过染色体位置和读取对的方向(STAR方法)对剩余的重排事件进行分类。
进一步分析39例融合癌基因组(FORs)的突变来源,其中10例LADCs由简单重组产生,包括大片段删除、reciprocal inversions(交互插入)、reciprocal translocations(交互易位)等;29例由复杂的基因重组产生,5例为涉及多条染色体的chromoplexy、2例为典型的chromothripsis(单条染色体内)、9例为涉及1-2条染色体的chromoplexy和chromothripsis共同作用、5例为多条染色体间chromothripsis等。
f2
Figure 2
图2 复制基因组重排产生融合癌基因
(A)LADC融合癌基因的基因组重排模式。
(B)产生EML4-ALK融合癌基因的chromothripsis的实例。 在LU-F16(上图)中,在染色体破碎后的重组过程中丢失了许多DNA片段,最终的足迹显示出典型的拷贝数不平衡。 相反,LU-FF107(底部)显示了拷贝数平衡模式。 重新排列被描述为垂直线和连接弧,其颜色表示不同类型的重新排列。 CN,拷贝数。
(C-E)产生LADC的驱动子融合癌基因的色素复合物(C),经典的染色体(D)和平衡的染色体(E)的实例。 大写字母表示DNA片段,它们的方向对应于它们在衍生染色体中的重排构型。 红色虚线表示DNA双链断裂,浅蓝色弧表示连接断裂点。
LADCs中融合癌基因的形成由多种类型的复杂重组产生,这可能是正常呼吸道上皮细胞恶性癌变的起始事件,尤其对于非吸烟者。
f3Figure 3
图三 涉及二次重排的复杂FORs-
模式实例
(A)产生ATP1B1-NRG1融合癌基因及其衍生染色体的4-way chromoplexy 的示意图。
(B)产生扩增的AXL-MBIP致癌基因的复杂重排和位于扩增子中的碱基取代(上图)。 虚线蓝线表示染色体片段中的平均变异等位基因部分。 显示了观察到的复杂重排的解释模型(下图)。 VAF,变异等位基因分数。
FORs vs CRs( complex genomic rearrangements that did not generate the known fusion oncogenes(referred to ascollateral rearrangements [CRs]))
f4
Figure 4
图4 FORs 和 CRs的基因特征
A:具有高比例平衡断点(≥0.4; STAR方法)的复杂重排簇仅占所有复杂星团的6%(482个中的31个),但它们在FOR中显着丰富(25个中的13个;优势比= 25.89, p <0.0001,Fisher精确检验)
B: 具有钝端连接特征的断点(表示NHEJ)在FOR中明显比在CR中更常见(比值比= 1.269; p = 0.0081),而在FOR中微观同源性或短核苷酸插入的频率低于CRs(优势比= 0.788; p = 0.0074)
C:复杂FORs在DNase-I-高敏,且在早期复制区域中显着富集
f5
Figure 5
图5 LADCs突变历史中早期致癌驱动因素的扩增时间
(A)在扩增融合子和驱动癌基因的点突变的时间点估计全基因组突变负荷。 从Z分数(STAR方法)计算95%置信区间。 每个病例的诊断年龄用黑点表示。 垂直虚线表示两个亚组中拷贝数扩增的中值时间。 两个样本,其中可以精确定位融合癌基因获取的时间,用星号表示。 根据(B)中的突变率将突变的数量(在上x轴中)转化为年龄,并且平行于下x轴绘制。
(B)没有超突变的二倍体LADC中体细胞碱基取代数和诊断年龄之间的相关性(n = 15)。
(C)LU-FF76和LU-4中融合癌基因形成的概念图。 在S / G2期细胞核中进行染色,然后进行不对称分离,导致主要等位基因的拷贝数增加(拷贝数= 2)。
(D)LU-FF76中含有KIF5B-RET的衍生染色体的详细结构(上图)和碱基取代(点)的拷贝数和等位基因特异性拷贝数分布(实线;底部)。 根据二项式概率(STAR方法)确定预扩增的取代。 CN,拷贝数。
f 6
图6复杂CR提供辅助驱动程序事件
(A-C)Circos图显示了全染色体染色体(A),染色体间染色体(B)和染色体外扩增(C)的典型实例。 红色三角形表示所描述的复杂重排。
(D)LU-F31中的MDM2 / CDK4共扩增,表现出频繁的复制介导的重排。 其显示了其重排结构(顶部),显示kataegis(中间)的交换距离,以及具有复制叉切换证据的代表性区域(底部)。 使用Integrative Genomics Viewer(实线,链合成;虚线,叉跳)的屏幕截图描述复制叉的流程。 碱基取代用点(中间)和三角形(底部)表示,具有以下颜色:蓝色,C:G> A:T; 黑色,C:G> G:C; 红色,C:G> T:A; 灰色,T:A> A:T; 绿色,T:A> C:G; 粉红色,T:A> G:C替换。
(E)重排的结构共同扩增LU-14(上图)和LU-SC81(下图)中的多个癌基因。
f7
不同的突变过程(S4-high与-low)和不同的早期驱动癌基因会导致不同的基因组改变景观。
S4-high LADCs中癌症相关基因突变的数目远超过S4-low;亚型中频繁突变的基因种类不同,S4-high中STK11、KEAP1、SMARCA4、TP53、KRAS等基因频繁突变,而S4-low则在细胞周期调控基因上有频繁突变;融合癌基因驱动的LADCs中TP53的突变很少,但SETD2的突变很频繁,与点突变类型的LADCs不同。