文献资料整理或解读

表观遗传学简介

2019-03-31  本文已影响195人  黄晶_id

基础概念

表观遗传学是与“经典遗传学”相对应的一门新兴学科,主要是指DNA双链序列未改变的情况下,基因的表达发生改变,即未改变基因型的前提下改变表型。从广义上讲,表观遗传学主要分为组蛋白共价修饰DNA甲基化染色质的高级结构,以及最近几年才引起人们高度关注的非编码RNA等。发生在DNA碱基上,组蛋白上或者RNA上的化学修饰构成了一系列的表观遗传学修饰,彼此相辅相成,形成一个庞大的遗传信息调控网络,调控机体各方面的正常运作,组成机体的“表观遗传密码子”。

DNA甲基化

DNA甲基化修饰是指在DNA甲基转移酶(DNA methyltransferase,DNMT)的催化下,以S-腺苷甲硫氨酸为供体将甲基连到CpG岛胞嘧啶5位碳原子上的过程。被修饰位点的碱基可以是腺嘌呤的N-6位、胞嘧啶的N-4位、鸟嘌呤的N-7位和胞嘧啶的C-5位,它们分别由不同的DNA甲基化酶催化,但大多发生在基因启动子区CpG岛上(原核生物中CCA/TGG和GATC常被甲基化)。在这个过程中没有改变基因序列,但是它调控了基因的表达。DNA甲基化主要发生在胞嘧啶的5号位置上(5-methycytosine,5mC),存在于多数哺乳动物和植物中。大约70%-85%的CpG位点处于高甲基化状态。Non-CpG位点的甲基化主要发生在植物中,而很少存在于动物体中。目前有研究表明non-CpG位点甲基化在卵子,胚胎干细胞(ESCs),以及成熟的神经元中的含量相对较多,但是其在哺乳动物中的作用还不是非常明确。

有越来越多的研究表明,DNA甲基化在疾病尤其是癌症的分级、发生发展、早期诊断、预后治疗等过程中起着关键性的作用。

染色质高级结构

人类基因组约30亿个碱基对(约3Gb),必须要高度压缩才能纳入微小的细胞中,并且必须要高度有序才能保证基因的正常表达和一系列生化反应的有序进行。有限的空间容纳巨大的信息量,生命体有着独特的承载生命信息的方式:基因组DNA双链与组蛋白相互缠绕折叠形成核小体,进而折叠形成30nm纤维核小体,然后进一步高度压缩成染色质。目前为止,己经有大量的顺式作用元件被注释到基因组上,但是如何确定这些顺式功能元件的作用靶位点,是目前该领域的一个挑战。其中一个行之有效的办法就是利用基于染色体结构的捕获技术研究这些功能元件的空间互作位点。基于此,有越来越多的研究表明,基因组在空间上与蛋白质组相识,能够形成一个有序的互作网络,使得在基因组线性距离比较远的DNA序列元件能够在空间上相互作用,并且能够发挥重要的生物学功能,比如调节基因表达。最近几年,出现了一系列基于染色质结构捕获技术(Chromosomeconformationcapture)的研究方法用于探究基因组3D结构以及空间相互作用,比如4C、5C、Hi-C以及ChlA-PET等。2013年任兵实验室利用Hi-C技术获得了人体细胞染色质相互作用组的高分辨率基因组图谱。该研究也证实了enhancer确实在空间上与启动子有相互作用。最近发展起来的单细胞Hi-C技术能够在单细胞水平完成染色质三维互作组分析,大大减少了样品用量。

非编码RNA(non-codingRNA,ncRNA)

随着2001年人类基因组计划(HumanGenomeProject,HGP)完成,研究人员发现人类基因组约30亿个碱基对中,仅仅有1.5%的核苷酸序列能够编码蛋白质,其余的约97%的核苷酸序列不编码任何蛋白质,这些不编码蛋白质的序列曾一度被认为是“垃圾序列”。但是随着生物学研宄不断的深入,越来越多的证据表明,所谓的“垃圾序列”可能具有重要的生物学功能,蕴含着巨大的生物学信息,包括DNA调控元件,转座子,非编码RNA等。2012“人类DNA百科全书计划(ENCODE)”完成,研究结果表明,人类基因组中大约75%的DNA序列能够转录成非编码RNA,其中大部分的产物为长非编码RNA(longnon-codingRNA,IncRNA)。国际上普遍认为长非编码RNA是指长度大于200nt核苷酸的RNA转录本。

长非编码RNA是具有功能的转录本,而非转录噪音,IncRNA在转录水平参与了基因的表达调控,在转录后水平参与了mRNA的剪切与加工、表观遗传学调控和印记调控等过程。越来越多的研究表明,长非编码RNA能够调控DNA甲基化以及染色质修饰和高级结构,从而达到表观遗传学信息调控的目的。长非编码RNA能够通过指导相关蛋白质,使之招募组蛋白或者DNA甲基转移酶到相应的空间位点,指导相应位点的DNA甲基化或者组蛋白甲基化。长非编码RNA与癌症的发生发展有着密切的关系,并且长非编码RNA异常表达具有很强的癌症特异性,暗示长非编码RNA能够作为癌症诊断的潜在靶位点。

组蛋白修饰

组蛋白(histone)是指存在于真核生物的细胞核中,与DNA结合存在的碱性蛋白质的总称。组蛋白含精氨酸和赖氨酸等碱性氨基酸特别多,二者加起来约为所有氨基酸残基的1/4。组蛋白与带负电荷的双螺旋DNA结合成DNA-组蛋白复合物。因氨基酸成分和分子量不同,主要分成5类:HI、H2A、H2B、H3、H4。H2A、H2B、H3和H4各两个单体组成八聚体,八聚体连同其外面缠绕的长度约为140bp的DNA,组成染色体的基本单元核小体。核小体和H1组蛋白单体以及linkerDNA组成染色体。

组蛋白的翻译后修饰多种多样,包括组蛋白甲基化、乙酰化、磷酸化、泛素化和糖基化等,除了这些研究的相对清楚的组蛋白翻译后修饰外,还有最近研究发现的一些组蛋白修饰,如组蛋白酰基化修饰。研究发现组蛋白酰基化修饰作用机制与其他修饰有所不同,并且有可能将细胞代谢和表观遗传学联系起来。这些多样化的组蛋白翻译后修饰在时间和空间上相辅相成,在细胞命运决定、细胞生长、机体发育、癌症发生发展和干细胞多能性等多个方面起着至关重要的在作用,逐渐的成为一种至关重要的表观遗传标志,因而被称为“组蛋白密码”

组蛋白甲基化

组蛋白甲基化是一种非常重要的组蛋白翻译后修饰,能够发生在核小体八聚体的各个组份上,但主要发生在H3组蛋白上,并且多在4号位、9号位、27号位、36号位等的赖氨酸残基上进行甲基化,而且相同位点还可以发生不同程度的甲基化,如一甲基化、二甲基化和三甲基化,并且不同水平的甲基化所起到的生物学功能也所不同。2007年科学家开创性的利用ChIP-seq技术绘制了全基因组的组蛋白甲基化图谱,使得研究人员能够从利用高通量测序技术从基因组水平研究组蛋白修饰的分布情况,以及进一步探究组蛋白甲基化的功能机制。

组蛋白甲基化酶和去甲基化酶

起初研究人员认为,组蛋白甲基化是一成不变的,是不可逆的,直到2004年第一个组蛋白去甲基化酶一赖氨酸特异性去甲基化酶的发现才打破了科学界对这一观点的认识。组蛋白甲基化可根据机体的需要在甲基化状态和去甲基化状态间进行动态转化。组蛋白的甲基化与去甲基化是在组蛋白甲基化酶和去甲基化酶的作用下完成的,二者相辅相成,功能密切相关。

组蛋白甲基化酶和去甲基化酶如何被招募到靶位点是目前研究的一个重要方向。特定的DNA序列被认为是将组蛋白修饰酶招募到靶位点的关键所在。最近研究发现,IncRNA能够通过与组蛋白修饰酶相互作用从而指导相应的修饰酶招募到靶位点,行使组蛋白甲基化和去甲基化的功能,但是组蛋白修饰酶在体内是如何被IncRNA指导募集的目前研究的还不是很清楚,仍有待进一步的发现探索。

表观遗传信息遗传

众所周知,DNA双链信息的遗传遵循孟德尔遗传定律,基因是作为遗传信息的首要载体。然而,随着表观遗传学的发展,越来越多的证据表明,除了基因外,表观遗传信息也能够作为一种遗传信息,在代与代之间传递。但是表观遗传学信息能否像DNA双链信息那样稳定的在代间遗传,是生命科学领域一直以来的研究热点。并且越来越多的研究发现,与DNA双链信息不同,表观遗传修饰容易受到外界环境的影响,环境的改变能够影响生物体表观组的建立。父母的生活环境和饮食习惯能够对后代的健康产生影响,表明环境诱导产生的表观遗传信息的改变能够通过配子传递给后代。

ChIP-seq技术概述

二代测序技术(NGS)从诞生至今,发展迅猛,变得越来越快,越来越准确,越来越廉价,越来越高通量。二代测序技术的快速发展推动了遗传学和基因组学等相关学科的发展。二代测序技术最大的优势就是能够全方位的综合的研究某一个物种的全基因组。随着二代测序技术的发展,表观基因组也得到了长足的发展,使得研究人员能够从一个崭新的层面去探究人类遗传信息。表观基因组的不断完成与发现也催生了一系列的测序技术的产生。下图列举了近10多年表观基因组研究过程中产生的具有里程碑作用的测序技术。


表观基因组研究过程中产生的具有里程碑作用的测序技术

ChIP-seq是一种非常重要的从全基因组范围研究染色质结合蛋白绑定位点分布模式的测序技术。从2007年被开发出来至今,己被广泛用于研究组蛋白修饰、组蛋白修饰酶与转录因子等染色质结合蛋白在全基因组范围的分布图谱。著名的ENCODE和RoadmapEpigeneticsProjects就是利用ChIP-seq技术解析了数百种人类细胞系的表观修饰图谱。
ChIP-seq实验原理主要包括:
1.在生理状态下通过甲醛处理将DNA绑定蛋白和DNA交联在一起,使之保持互作的状态;
2.然后裂解细胞,通过超声或者酶切将染色质片段化,染色质片段长度一般200-600bp;
3.然后利用目的蛋白相应的抗体进行免疫共沉淀,将所需的DNA-蛋白复合物拉下来;
4.最后解交联,将DNA片段释放出来,利用二代测序仪进行测序。

ChIP-seq实验的成功与否与很多因素有关,其中所使用抗体的质量是一个至关重要的因素。高灵敏度和高特异性的抗体能够很好的集合目的蛋白,使得后续检测绑定位点更加的准确灵敏。许多抗体都己经商业化,但是不同的抗体质量参差不齐,甚至不同批次的同种抗体都会有很大差别。因此,开展ChIP-seq实验最好使用同一个公司相同批次的抗体,并且在正式实验之前进行预实验评估所用抗体的灵敏度和准确度。样品量是影响ChIP-seq实验的另一个重要因素。样品量太少无法得到一个完整的可靠的目的蛋白的全基因组分布图谱。当然,随着技术不断的进步,完成一次ChIP-seq实验的样品量在不断的减少。为了保证ChIP-seq实验的准确性,设计对照组是必不可少的。检测出的Peak需要和相应的对照组进行对比以确保其显著性,即这个目的蛋白在这个区域的富集是否可靠。一般有三种DNA可用作对照组:不进行免疫沉淀(IP)的DNA;进行IP但不用抗体去拉而得到的DNA;用非特异性抗体进行IP得到的DNA。第一种不进行IP的DNA几乎用于所有的ChIP-seq实验的对照组。测序深度也是影响ChIP-seq数据分析的一个重要因素,对于一个ChIP-seq实验而言,需要多少的测序深度取决于基因组的大小以及所研究的peak类型。有报道称,就人类基因组而言,建议不少于20 Muniquemappedreads用于“窄”peak的研究,40-60 Muniquemappedreads用于“宽”peak的研究。

任何技术都不是完美的,都是在发展过程中不断完善的,ChIP-seq技术也不例外。ChIP-seq面临的最核心的问题是它所呈现出来的结果是一群细胞中目的蛋白相对富集情况,而无法识别目的蛋白在某个区域的绝对含量。灵敏度和精确度也是ChIP-seq技术目前急需解决的问题,有些修饰相对于对照组会有10-100倍的富集,因此能够得到一个可靠的富集信号;但是有些目的蛋白的信号本身就比较弱,但是从生物学意义上讲同样的重要,这种情况下,ChIP-seq就很难区分所监测到的微弱信号是由于IP不足或者测序不足造成,还是生物体本身存在的真实信号。还有一点不得不考虑的因素,那就是ChIP-seq实验的费用目前还是比较昂贵的,包括测序费和试剂费等。尽管如此,随着测序技术不断进步,上述存在的问题也不断的得到解决,在今后一段时间内ChlP-seq应该还会得到广泛使用。

2015年来自美国的科学家研发了单细胞ChlP-seq技术,从单细胞水平揭示了不同的细胞组蛋白甲基化修饰谱,并通过组蛋白甲基化差异鉴定出一系列的细胞亚型。虽然这是一项里程碑式的技术革新,但是该技术测序的覆盖度很低,仅仅检测到1000个左右的peak。

参考文献:
1.博士毕业论文《H3K4me3和H3K27me3组蛋白甲基化修饰跨代遗传规律研究》的前言
2.https://www.jianshu.com/p/10ecfe8e70ee
3.https://mp.weixin.qq.com/s__biz=MzUxMzk5ODQyMw%3D%3D&mid=2247483722&idx=1&sn=bd6bf5eefef9ef26630bfc9573dc1119&scene=45#wechat_redirect
4.https://www.jianshu.com/p/1df7779c1f77
5.https://mp.weixin.qq.com/ssrc=11&timestamp=1554017864&ver=1517&signature=1YPEHnkfKy4uHjoRrEx1zJ2I3YGFn3I7v9rIkcL3lAFhp3OR4UJoJRCkzucGZ886z9i--ByF5dytTolWEWqbeLulUQpKxbyNFHydh0W68Q0oskPx6BNvUkVoAHheao&new=1
6.https://mp.weixin.qq.com/ssrc=3&timestamp=1552663355&ver=1&signature=AuoVIl1o5QnbHyy2Qc6ZhRrogXrb8eu7K1UJVCOzq6vDCivk2Tv35wg72xX8wth4PFDrkakSHnnF4ZwuLKc6-ozmVhx4FkOme2N0kfK-ocDxs1YNgBzIPomid2YN-SMVrzvzQIwU9OX723K6BHqxcSO9gw0rAO0M8t8ew4=

上一篇下一篇

猜你喜欢

热点阅读