生物信息学与算法生信必备生物知识甲基化相关

DNA甲基化的前生今世

2019-03-14  本文已影响40人  黄晶_id

DNA的甲基化是在DNA的序列不变的条件下,在其中某些碱基上加上甲基的这样一个过程。DNA甲基化的结果,一般是使甲基化位点的下游的基因表达量变少。

1.DNA甲基化的位置

(1)基因区间
主要作用是是抑制潜在有害遗传元件的表达。(如插入的病毒原件)

(2)CpG群岛
CpG岛是大约1000个碱基对的DNA片段,大多数基因启动子(大约70%)位于CpG岛内,CpG岛的甲基化可损害转录因子结合,募集抑制性甲基结合蛋白,并稳定沉默基因表达。

(3)基因体
基因体的DNA甲基化如何促进基因调控仍不清楚

2.化学反应:

甲基化分析方法当中的核心化学反应,是用亚硫酸氢盐来处理DNA。DNA当中,没有甲基化或羟甲基化的C碱基,就会被转化成U碱基。

我们来看这个转化的过程,在弱酸性条件下,亚硫酸氢根会结合到没有甲基化的C碱基的6位。而甲基化了的C碱基不会和亚硫酸氢根发生这个反应的。

然后,用碱来处理。结合了亚硫酸氢根的非甲基化的C,就被脱氨基,并且脱亚硫酸根。然后,就被转化成U碱基。

那么,甲基化或者羟甲基化的C碱基,因为之前没有和亚硫酸氢根起反应,所以现在用碱来处理,它也不会发生脱氨基反应。所以,它还保持了是“C”。

用亚硫酸氢盐来处理DNA,可以让99%左右的非甲基化的C碱基变成U。也就是说这种方法的的转化效率非常高,转化效率达到了99%。

它的优点,就可以让我们接下来通过高通量测序的方法,可以精确地看到单个碱基的甲基化的水平。

经过亚硫酸氢盐转化过的DNA,再经过PCR,PCR新合成出来的链,U碱基的位置,就会被替换成了“T”。那么在接下来的测序过程中,测到的也是T碱基。

而甲基化的C,因为没有被亚硫酸氢盐所转化,所以,在接下来的测序过程中,被测到的,还是“C”碱基。

这样,通过测序,看一个位置是“C”,还是“T”。如果它保持是“C”,就说明这个位置是被甲基化、或者羟甲基化了。如果测到的是“T”,就说明这个位置是没有被甲基化、或者羟甲基化。

3.建库方法

第一种建库方法,用Illumina公司的Truseq DNA建库方法,来做甲基化测序。因为Illumina Truseq DNA建库试剂盒当中,它所提供的接头,那么这个接头上的C碱基都是已经经过甲基化修饰了。所以,用这些接头做出来的文库,在用亚硫酸氢盐做转化的过程当中,它的(接头上的)C还是保持是C ,不会被转成U。带了这些接头的文库分子,就可以和测序芯片上的草皮DNA发生互补杂交。并且进一步发生桥式PCR反应。生成测序用的DNA的簇(Cluster)。

但是,这个方法有一个缺点,就是在用亚硫酸氢盐处理DNA文库的时侯,90%以上的DNA链会断掉。这样,已经建好的文库,其中90%分子会被破坏掉。也就是说文库的丰富度就会损失90%以上。那么,相应的它有它的好处,它的好处就是,在这个建库过程当中用的PCR循环数较少。所以它PCR扩增效率不同,所引起的文库不均一程度也就较低。也就是我们通常所说的PCR bias较少。

第二种建库方法。
为了解决文库丰富度受到损失的这个问题,EpiCentre公司开发了EpiGnome方法,方法的操作过程如图。


第1步,亚硫酸氢盐先处理DNA,把未甲基化的C都转变成U。
第2步,把带标签1的随机引物加入,进行第一次的复制。得到第1条的复制链。
第3步,是消化掉过量的引物。
第4步,是加入带末端终止碱基、并带标签2的随机引物。这个引物的作用是让第1复制链延伸,并且加上标签2。
第5步是加入建库的PCR引物,进行PCR。通过PCR,把Index序列和成簇引物序列加入到链的两侧。得到真正的文库。

这个方法的优点是,把亚硫酸氢盐处理的过程,放在了建库之前。这样建成的库的丰富程度会比较高。但是这个方法也有缺点,缺点就是要做较多的PCR循环,那么有了比较多的PCR循环之后,PCR产物的扩增均一性是不太好的。也就是说PCR bias会比较大。

上述两种方法,各有优缺点。

因为甲基化文库中经过亚硫酸氢盐处理,绝大多数的C都变成了T。所以,这个文库中是严重地缺少C碱基的,也就是四种碱基的比例是严重不平衡的。这样在用HiSeq 2000或2500测序仪来测甲基化文库的过程当中,文库测序得到的数据质理就较差。并且经过PF过滤得到的有效的数据产量也会较低。

为了弥补甲基化文库的碱基不平衡性,一般情况下,在上机过程当中,是掺入大比例的基因组文库,或者PhiX文库,来补充比较多的C碱基,一般会掺30%的PhiX文库、或者基因组文库。

在掺入30%的PhiX文库的条件下,一条HiSeq 2000 V3 PE100的Lane,大概可以得到20G 左右的甲基化文库数据。

也就是说,在HiSeq 2000或者2500平台上,甲基化文库的测序数据产量,一直都不是很高。质量也比较低。


4.甲基化综述文章

发表在《Lancet》(IF=53.254)上的《Principles of DNA methylation and their implications for biology and medicine》对DNA甲基化的原理及其对生物学与医学影响进行了最新阐述。

DNA甲基化是一种共价修饰,发生在胞嘧啶核苷酸上,且几乎总是发生在CpG上。细胞中广泛的蛋白质系统通过从头甲基化或甲基基团在DNA上“写下”甲基化模式,并在DNA复制期间通过一系列因子“忠实地”复制甲基化模式。除了这些“书写工具”,细胞还包含许多读取DNA甲基化及将注释转化为功能信息的蛋白质因子。

基因调控序列(如启动子或增强子)上的DNA甲基化会抑制基因表达,这种抑制作用是通过识别甲基的蛋白质系统招募能特异性编程以产生闭合的染色质结构的因子,使转录机器不易接近基因来完成的。

image

一、DNA甲基化的重编程

DNA甲基化是一个表观遗传过程。与直接从父母那里继承DNA序列所不同的是,源于配子的甲基化模式在胚胎植入前会被清除,并在每一个个体中重新建立起新的甲基化图谱。重置的过程可分为2个不同的阶段:

首先是在胚胎植入过程中,除了大量启动子序列(CpG岛)被特异性识别和保护而不被甲基化修饰(保持未甲基化状态)以外,几乎整个基因组都被重新甲基化。虽然这种情况只发生1次,但产生的双峰甲基化模式却能通过简单的半保留机制,在所有随后的胚胎细胞分裂中得以维持。由此,身体中每个细胞都携带着这种“胚胎­生成”的基本模式。

image image

这一表观遗传过程在建立起整个生物体的基本基因表达基础方面起着重要作用。通过使用只需要很少识别线索的简单分子程序,这一注释图谱在整体上可抑制不需要在细胞中表达的序列,包括非组织相关的基因、基因组中各种有害的病毒序列。这一过程代表了哺乳动物细胞中DNA甲基化的主要功能,即保持如人类这样的长寿生物的表达模式的稳定性。此外,调控许多类管家基因的CpG岛序列更优先于保持未甲基化状态,使其在各种细胞类型中开放表达。组蛋白修饰是对基因组进行注释的另一个系统。与共价连接到遗传物质本身的DNA甲基化所不同的是,组蛋白修饰发生在染色质蛋白上,通常依赖于附近不与DNA永久结合的修饰因子。因此,尽管DNA甲基化是自主稳定的,但组蛋白却较少如此,这使得DNA甲基化成为细胞记忆的主要机制。

其次,DNA甲基化重置模式的第2阶段,涉及在基线甲基化图谱上引入高度离散的变化,这与细胞谱系分化和器官发生协同发生。

从胚胎植入时开始,一些未甲基化的基因在特定发育阶段或特定细胞类型中被关闭后会从头甲基化;与此同时,许多启动子和其他关键调控区在组织特异性分化过程中会被去甲基化。

image

在这2种情况下,DNA甲基化的改变都是以程序化的方式来进行的,涉及能在局部招募从头甲基化与去甲基化机器的蛋白因子对序列的特异性识别。

一旦一个新的甲基化状态得以建立,它就会产生一个极其稳定并在该生物体之后的生命历程中进行保持的组织特异性的染色质模板,该模板是组织特异性基因表达的结构基础。

image

综上所述,** DNA甲基化似乎并不会“关闭基因”,更像是“锁定机制”那样阻止基因的激活。因此,与调控基因表达严格的动态机制所不同的是,DNA甲基化状态可以长期记忆之前由转录因子介导的,而且目前不在细胞中存在的“基因表达决定”;这一重要原则也有助于我们理解DNA甲基化对于衰老和疾病的影响。**

二、DNA甲基化与衰老

在发育过程中,DNA甲基化的事件以高度特异性的方式发生,塑造了已分化组织的表达模式。除了这些程序化的事件之外,从胚胎开始似乎还发生了一个更随机的过程,并随着时间的推移而缓慢进行,导致基础基因组修饰模式的部分改变;

这个过程包括与多梳状阻遏物结合的CpG岛的从头甲基化、基因组其他大区域的去甲基化。这些变化发生在所有组织中,产生一种独特的模式,并随着衰老而增加。实际上,通过测量血细胞中小部分位点的甲基化状态,就可能获得一个能非常准确反映个体年龄的指数值。

image

关于人类和老鼠的实验显示:快速衰老模型中的指数值增加了,表明这种表观遗传分析所检测的是“生物学意义上的老化”,而不是“按照时间顺序的老化”,因此可以反映个体的整体健康状况。事实上,长寿的个体与他们的实际年龄相比,似乎有一个年轻的“表观遗传年龄”。此外,从血液样本所测量的甲基­老化时钟被认为是人类全因死亡率中死亡时间的强有力的预测因子。这些甲基化变化是否会影响衰老过程本身还不清楚,也没有证据表明生活方式会影响这种模式。

三、疾病中的DNA甲基化

DNA甲基化也在一些人类疾病中起作用。例如,脆性X综合征是由于在早期发育阶段缺乏FMR1活性而引起的。由于FMR1组成性表达,其缺陷会导致许多组织产生症状。在几乎所有情况下,FMR1的缺失不是由于基因编码区本身的突变所造成的,而是由于其启动子发生了异常甲基化。这种从头甲基化导致的FMR1基因抑制在整个生命过程中得以保留。

DNA甲基化也在一些印迹疾病中起潜在作用。与大多数基因所不同的是,基因组的印迹区域仅由一个单一的等位基因(父本或母本)表达而来;这种单等位基因表达的发生是由于一个配子(精子或卵母细胞)中的从头甲基化维持到后代的成年期,在每个细胞中用于抑制其中的一个拷贝。

诸如Prader-Willi、Angelman或Beckwith-Wiedemann之类的综合症通常是由于印迹区域的活性等位基因上的遗传变异所引起,从而导致基因表达的完全缺失。在极少数情况下,遗传缺陷会影响局部控制DNA甲基化本身的顺式作用序列。由于印迹疾病部分是由于异常甲基化引发的基因抑制所造成的,因此这提高了与其它由突变产生的缺陷有所不同的可能性—这些综合征可以在表观遗传水平上通过药物或者其它干预措施来进行治疗。

从理论上讲,类似的干预方法可用于逆转脆性X综合征中的FMR1抑制,以及在其他遗传性疾病中重新激活替代基因,如在β地中海贫血或镰状细胞贫血中的胎儿珠蛋白;或在杜氏肌营养不良症中使用抗肌萎缩蛋白相关蛋白(Utrophin)去替代抗肌萎缩蛋白 (dystrophin)。

四、癌症中的DNA基化

癌症是从一个单细胞开始的,这个细胞经历了许多变化,使得其表型与它正常的前体不同。尽管这个过程可以由控制细胞生长的关键基因所驱动,但许多表达的变化可能是由于表观遗传改变(主要是DNA甲基化)。

**这些DNA甲基化变异从何而来? **

一个主要的特征是:肿瘤甲基化图谱的产生模式与正常细胞衰老过程中甲基化图谱的产生模式几乎相同(但增加的幅度更大),表明这些甲基化特征在转化成肿瘤细胞前的初始细胞中已经在某种程度上存在。

事实上,甲基化的这种基本改变很可能与复制一起,在肿瘤形成前细胞生长的克隆选择中起作用。支持这一观念的是,研究者观察到任何组织一生患癌的风险与正常组织中异常老化有关的甲基化变异的程度直接相关。例如,结肠细胞的异常甲基化的程度相对较高,且易患癌症;但神经细胞极少异常甲基化,发生肿瘤的风险也较低。

除了加速老化相关的异常甲基化这一基本而主要的表观遗传特征以外,癌细胞也会发生由肿瘤微环境或在细胞甲基化管理机器中起作用的基因的体细胞突变所诱导的甲基化变化。比如,高比例的脑胶质瘤中异柠檬酸脱氢酶突变、髓系恶性肿瘤中TET突变、急性髓系白血病中DNMT3A突变,均会对DNA甲基化产生影响。

这些联合的表观遗传事件的总体影响是改变基因表达模式:允许致癌基因表达,或阻止参与生长抑制、分化或DNA损伤响应的基因激活。

因此,尽管DNA甲基化可能并不在所有癌症中起主导作用,但毫无疑问的是,这些修饰模式的变化最终会影响细胞的易感性和肿瘤表型。这些观念导致研究者开发出一些去甲基化的药物(如氮杂胞苷),在治疗特殊肿瘤方面很有用。这些药物也可以通过引起被抑制的肿瘤抗原的去甲基化,及扭转­T细胞耗竭,来增加癌症免疫治疗的疗效。此外,选择性靶向甲基化畸变可以提供癌症有效的治疗或预防措施。

五、环境与DNA甲基化

虽然现在普遍认为环境并不会直接影响基因序列,但研究者们对“我们周围的事件可能会引起表观遗传变化”进行了大量推测,如DNA甲基化可能会长期影响基因表达模式。这种效应可以在Agouti-Yellow小鼠中观察到,在Agouti基因中有额外的DNA片段,使其变得肥胖与黄色。在母亲怀孕期间喂养额外的维生素(如B12、叶酸或胆碱)会导致后代的表型发生改变(薄的棕色皮毛),即使这些动物在基因上与原始的种类完全相同。这种效应伴随着在Agouti基因位点增加DNA甲基化,间接显示了表型是如何被由母体营养变化所引起的表观遗传事件所影响的。

Barker和同事通过对人类疾病的临床观察,提出这样的假设:胎儿宫内发育迟缓、低出生体重或早产,可能与以后的高血压、冠心病和糖尿病有关。小鼠实验已经显示:化学诱导的炎症会引起肠上皮发生大的DNA甲基化变异,这可能会使该组织易患癌症。这种思考也被用于将环境影响(如营养、压力或接触有毒物质)与各种疾病的发病机制联系起来。细胞外因子的变化在影响机体不同细胞的同时,会导致长期修饰基因表达模式的染色质结构的长期变化。

六、诊断人类疾病

DNA甲基化的一个新兴且令人兴奋的临床应用是在疾病诊断领域。细胞死亡会释放DNA片段到血液中,这种cfDNA可以作为一个有价值的诊断工具—液体活检。例如,通过分析cfDNA可以发现母体血浆中的胎儿染色体畸变。

这种方法也被用于检测ctDNA中的特定突变,以监测癌症进展或对治疗的响应,即使是在无法接近肿瘤或肿瘤的位置未知的情况下。cfDNA分析的另一个应用是通过追踪在受体血液中携带供体基因组遗传标志物的DNA分子,来评估移植器官的排斥反应。

在这些已建立的方法中,诊断是基于感兴趣的组织(胎儿、肿瘤或移植物)与宿主之间的基因差异。液体活检概念的另一个应用是使用DNA甲基化模式来识别cfDNA的细胞类型来源,以普通的方式来监测特定组织中的细胞死亡。

事实上,人体中的每种细胞类型都具有独特的DNA甲基化图谱,而且在健康细胞和患病细胞的整个生命过程中保持稳定,使DNA甲基化图谱可以很好地识别来源于任何特定组织的死细胞释放出的DNA。

image

这种方法可在医学的许多不同场景中得到应用。例如,我们可以通过检测患者血浆中肝细胞或心肌细胞DNA甲基化标志物来监测肝脏或心脏的病理性损伤。原则上,我们需要鉴定在单个特定组织中未被甲基化,但在身体的所有其他细胞类型中完全被甲基化(或者,在感兴趣的组织中被甲基化,但在其他地方未被甲基化)的基因座。

DNA甲基化模式的一个重要应用是从活检样本中诊断和监测癌症。分析肿瘤活检样本中特异性的甲基化标志物,可以帮助我们确定几乎任何肿瘤的细胞来源,这对于肿瘤原发来源不明的病例尤为重要。此外,DNA甲基化的癌症特异性变化可以提供疾病严重程度的准确指示,并成为相对简单的预后标志物。

DNA甲基化谱最有前景的应用是以无创的方式来诊断癌症和监测癌症进展。癌症与增加的细胞死亡并将DNA释放进入血液循环有关;因此,分析cfDNA中组织特异性的DNA甲基化模式可以监测肿瘤动态变化与追溯肿瘤来源。随着灵敏度的提高,分析cfDNA中与突变结合的甲基化模式,使得对癌症的早期诊断成为可能。此外,该系统还可用于监测预期的癌细胞死亡与健康组织中非预期的毒性,以及监测疾病复发。

高通量分析可以识别体内所有细胞类型的多个不同的甲基化位点。这些信息可以用来开发一个用于描绘cfDNA中完整的细胞­类型图谱的通用检测,使得从单个血浆样本中获得组织特异性细胞死亡的完整个体图谱成为可能。该方法还可以在体内研究正常的人体组织动力学;以及获得非侵入性资源,用于早期检测与监测包括细胞死亡在内的所有人类病理。

七、未来的研究方向

虽然我们现在已经对DNA甲基化在人类生物学中的作用有了全面了解,但仍有许多与医学密切相关的热点研究领域值得我们去探索。有相当多的证据表明,饮食或压力等参数可以改变人体中许多组织的甲基化模式,但我们对这一过程的细节及其生理作用还缺乏理解。

是什么激素样效应器和信号转导途径介导的这些改变,它们又是如何调节细胞功能的呢?此外,最重要的问题是,DNA甲基化在可能改变衰老过程和使个体易患各种疾病期间,是否是长期稳定的?在血细胞中发生的甲基化变化,也可以作为监测当前和过去环境对每个个体的影响的生物标志物。

一些研究已经表明:父母接触各种环境条件(例如饮食和压力)可以影响其后代的长期生理机能;这些影响大概是从父母生殖细胞的改变而来,并以某种方式传递给他们的后代。尽管非编码RNA­在这个过程中起到作用,但我们仍然不清楚这些信号是如何产生稳定的标记,来影响许多细胞世代之后的体细胞。DNA甲基化很有可能参与其中,但我们还需要新的研究来了解其作用机制。

再生医学的一个基石是,人类胚胎干细胞可以在体外分化成任何类型的细胞,并用于替代治疗。将干细胞转化为体细胞组织的一个关键是获得适当的表观遗传信号—DNA甲基化在这其中起着主要作用。控制这些甲基化模式的规则尚未被充分阐明,但有望找到人工调控DNA甲基化的方法;先进的技术应能控制分化过程,使其模仿体内的情况。

诸如阿扎胞苷之类的药物的单药使用或者与其他制剂的联合使用,已用于癌症治疗;但这种方法似乎是通过在靶细胞中造成广泛的去甲基化而起作用的。CRISPR技术可以将酶促的DNA甲基化机器靶向至基因组的特定位置,使得DNA发生特异的甲基化改变以控制基因表达成为可能。这一技术一旦被开发出来,就可用于治疗各种形式的癌症以及其他以异常甲基化模式为特征的疾病。

参考资料:
1.陈巍学基因
2.https://www.jianshu.com/p/c5bf297518ee
3.https://www.jianshu.com/p/c4f758e0399d
4.公众号智汇医圈文章

上一篇下一篇

猜你喜欢

热点阅读