5月week1:肝癌全基因组变异landscape
肝癌全基因组变异landscape
这篇文章是2016年发表在《Nature genetics》上的一篇文章 Whole-genome mutational landscape and characterization of noncoding and structural mutations in liver cancer, 主要研究了来自日本的300例肝癌患者的全基因组数据,旨在分析其非编码区以及编码区的变异,包括SNV, STV, 病毒整合等。这篇文章发现了与肝癌发生以及频发区域相关的mutation signatures,如lncRNA (NEAT1和MALAT1),启动子区域,CTCF结合位点等。该文章发现STV与复制时间强关联,且在已知的基因(CDKN2A, CCND1, APC和TERT)以及新鉴定的癌症相关的基因(ASH1L,NCOR1和MACROD2)中的STV会导致差异表达。这篇文章说明通过全基因组测序分析有利于挖掘癌症驱动基因。
背景介绍
肝癌的全球发生率(第五)和死亡率(第三)均很高,HBV和HCV病毒感染是造成肝癌最主要的因素,除此之外,饮酒、代谢相关疾病以及接触致癌物质也可导致肝癌的发生。有研究通过外显子以及小规模全基因组测序分析鉴定了TP53编码区域的突变,以及其相关分子,包括WNT信号通路相关分子(如CTNNB1和AXIN1)以及染色质调控相关分子(如ARID1A,ARID2和BRD7),这些变异在30%-60%的患病样本中检测到。之前研究也鉴定了肝癌中的潜在治疗靶点,如JAK,IDH,FLT家族基因和mTOR通路相关基因等。然而肝癌患者中仍然有很多频发突变的蛋白编码基因在患者中的发生率低于5%,这表明肝癌发生的多样性。目前对于肝癌的不同致癌物暴露以及癌症发生的mutational signatures比较明了。除此之外,有研究通过pan-cancer分析表明一些非编码调控区域的体细胞突变在基因表达和癌症发生过程中起着重要的作用。例如,在肝癌中发现HBV整合区域以及TERT promoter区域的频发突变。几种癌症的全基因组分析发现一些STV通过改变基因组结构在癌症发生过程中发挥重要的作用,也发现几种典型的突变模式,这些模式与基因组的稳定性例如chromothripsis(染色体碎裂)。
这篇文章主要通过对300例来自日本肝癌患者进行全基因组测序(>30X)以及RNA-seq分析。综合全面的分析结果表明STV和非编码区域变异可以影响基因表达以及调控功能。
结果
一、300例肝癌患者的全基因组测序结果以及变异分布情况
300例样本中,268例属于肝癌(HCC),24例属于内胆管癌(ICC),8例属于cHCC/ICC。159例HCV感染,82例HBV感染,4例HBV/HCV均感染,55例都不感染。通过全基因组测序并做变异检测,总共有9718个SNP,271 插入/缺失,40.6 STV,HBV阳性样本中检测到2.5个HBV整合位点。图一展示的是300例肝癌样本中的变异和频发突变特征。总共38个特征,分布于9个大类,包括WNT信号通路、染色质调节等。可以看出,TERT的非编码区域在>150个样本中检测到Noncoding SNV,且这些阳性突变样本大多为HCC。
Fig.1
另外也发现SNV的数目与患者的年龄、肿瘤的直径和吸烟程度呈正相关。文章也分析了SNV的数目与DHSs(通常用于评估染色质的可接触性)和复制时间之间的关系,发现具有较少的DHSs和较晚复制时间的区域具有较多的点突变。
二、Mutaional signatures
已有相关报道称特定类型的癌细胞具有特有的signature。最早发现收紫外线照射容易发生C->T或者CC->TT的突变。高通量测序的出现使得在癌症全基因组测序结果中寻找特定的mutational signatures成为可能。例如在肺癌患者中发现与吸烟相关的mutational patterns。
在HCC中鉴定出7种mutational signatures(W1 - W7)(Fig. 2(a)),这里面除了signature W6外,大多数的Signature与与COSMIC中的类似。Signature W6主要是T>A突变类型居多,也许这是一种新的signature。
分别分析七种signature与样本临床背景和遗传突变的线性关系,发现Signature W3和W4与年龄具有显著相关性(P=0.0059和3.410^(-7))。而signature W1与年龄无关。Signature W4与TP53基因的突变(P=0.0067)、吸烟程度(1.710^(-5))有关,也与肝癌与膀胱癌或输尿管癌共发(P=0.0030)有关。而Signature W5与酒精摄入(P = 0.0031)有关,Signature W3和W5与TERT promoter区的突变有显著关系(P=0.0052和0.0030)。Signature W2与AIRD家族基因突变有关(P = 0.0011)。Signature W4,W6,W7与双核苷酸替换明显相关(P < 210^(-16),< 210^(-16)和P = 4.0*10^(-5))。根据7种mutational signatures,可以将肝癌分为9种group。
三、病原检测与病毒的整合
总共鉴定出223个HBV整合事件,发现的频繁整合的位点位于TERT,KMT2B,SOX5的gene和promoter区域。样本种的HBV整合位点数目与STV数目相关,这是由于HBV整合位点常常位于双链DNA断裂位点,因此大量的STV可以增加HBV整合的几率。
通过分析转录组数据,在两个肝癌患者样本和三个正常组织样本中检测出了腺相关病毒(AAV)基因组,并在三个样本中发现了AAV的整合位点,这三个样本也同时感染了HBV或HCV。整合事件有的发生在KMT2B基因序列,有的发生在CCNE1基因的内含子,有的发生在5号染色体的基因间区。KMT2B在感染了AAV或HBV的样本中显著高表达。
四、频繁突变的蛋白编码基因
为了鉴定肝癌组织中的癌症驱动基因,文章总共鉴定了25个基因中含有大量的导致蛋白质功改变的突变,包括TP53,CTNNB1,ARID2,ARID1A,RB1,AXIN1,RPS6KA3,SETDB1,NFE2L2,BAP1和HNF4A。在CTBNN1在HCC中的突变频率明显高于ICC。功能丧失的突变主要存在于14个基因中,包括ARID2,ARID1A,AXIN1,TP53,BRD7,RPS6KA3,RB1和HNF4A中,这表明这些基因具有肿瘤抑制作用。这25个含有导致蛋白质改变的突变的基因主要为染色质调控和细胞周期调控相关的基因。
五、频分突变的非编码序列
文章发现29个非编码区域含有大量的突变,其中TERT的promoter区域是最为显著的(Fig. 3a),在其他癌症中也有相同的发现。另外发现6个lincRNA具有大量的变异,也在19个promoter区域和UTR区发现有大量的突变。其中,TFPI2的promoter区域的突变可使改基因表达明显下调(q = 0.053)(Fig .3b)。而NEAT1和MALAT1在染色体上的位置相邻,分别在66%和 6%的肝癌样本中发现有该突变。在胃癌、肺癌、乳腺癌中发现有这些基因有>5%的突变率。NEAT1在构建亚细胞核结构等方面发挥了重要的作用,且在不同的癌症中表达差异较大。 Fig.3六、非编码区域的突变cluster
文章总共鉴定出103个突变cluster,其中87个region集中分布于三个癌症基因的5个外显子中,这三个基因分别是:TP53,CTNNB1和NFE2L2,22个region都存在于ALB基因上。三个region分别存在于TERT,WDR74和MED16的promoter序列(Fig. 4a)。这些区域的突变可以改变调控活性,但活性的改变方式是多样的(Fig .4b,c)。
Fig.4
七、STV特征与基因表达
STV突变pattern与SNV的不同。HepG2细胞中具有不同复制时间的区域上的串联重复、缺失以及染色体异位差异明显(P = 3.710^(-32),1.810^(-6)和0.0039)。串联重复较易出现于早期复制区域而缺失较易出现在晚期复制区域。染色体异位发生在早期复制区域的概率较高。和乳腺癌样本一样,肝癌样本中的串联重复大概率出现在早期复制区域。
频繁发生STV的已知的(CDKN2A,CCND1,APC和TERT)和新发现的(ASH1L,NCOR1和MACROD2)肿瘤相关基因,从而影响基因的表达。
八、临床意义以及预后相关性的分析
最后,文章分析了编码区域和非编码区域的所有突变类型与临床背景数据之间的关联。发现TERT的突变与吸烟相关,CTNNB1的突变与HCV的感染相关,BRD7的突变与HBV的感染和酒精摄入有关。根据驱动基因的突变情况(如TP53,CTNNB1,CDKN2A,MACROD2,和ARID2或PBRM1),肝癌可大致分为6类。文章发现这些基因群与年龄、性别、肿瘤分级、术前或辅助治疗后的DFS(P = 0.002)以及肝纤维化(P = 0.012)显著相关。
总结
目前癌症是全球危害人类健康的疾病,随着高通量测序的出现,癌症基因组得以解析。这篇文章较为全面的分析了肝癌的变异landscape,可以为其他癌种的全基因组分析方法提供参考。同时这篇文章的成果可以向肝癌个体化治疗方向发展,可以期待以这些基因组突变作为靶向的肝癌新型诊断、治疗、预防方法的开发。
——————————————————————————————————————
***** 第一次写,还请批评指正 *****
——————————————————————————————————————