水稻表观遗传学综述
Epigenetic regulation and epigenomic landscape in rice
ABSTRACT
表观遗传调控参与调控水稻的复杂农艺性状。高通量测序技术和水稻自身复杂度适中的基因组,使得在全基因组水平上研究水稻表观遗传调控成为可能。此篇综述讨论了最近水稻表观遗传调控方面的进展,重点关注了关键的表观遗传调控元件、表观基因组图谱、表观遗传变异、转座子沉默以及植物发育方面的问题。
INTRODUCTION
表观遗传学Epigenetics最早于1950s由Conrad Waddington(英国胚胎学家、遗传学家、哲学家,参见大英百科全书https://www.britannica.com/biography/C-H-Waddington)提出,是研究不改变DNA序列的前提下,稳定可遗传的基因表达调控机制。表观遗传调控的机制包括DNA methylation、histone modifications and variants、chromatin remodeling、and non-coding RNA介导的基因表达调控。表观遗传调控在多细胞生物的发育和生物学过程的多个方面起到不可或缺的作用。
DNA METHYLATION
DNA甲基化是一种在进化上保守的表观遗传修饰,发生在DNA链的CG、CHG、CHH(H代表A、C、T)胞嘧啶残基上。DNA甲基化调控基因表达并且抑制转座子的转录和转座,因此在真核生物基因表达水平、转基因沉默、基因组印记、基因进化、基因组稳定性以及多倍体适应中发挥中关键性的作用。相比于动物DNA甲基化主要发生在CG的胞嘧啶残基,植物胞嘧啶甲基化可以发生在CG、CHG、CHH中。Non-CG甲基化主要在转座子区域发现,CG甲基化主要发生于TEs和gene bodies。
The DNA methylation landscape
DNA甲基化在植物发育中起到关键作用,多个研究绘制了水稻在生殖发育、种子发育 、愈伤组织多个发育阶段以及在杂交水稻、不同胁迫处理如盐胁迫、干旱胁迫、磷胁迫以及农药胁迫条件下的全基因组甲基化修饰图谱。水稻全基因组胞嘧啶甲基化水平是拟南芥的四倍,可能是由于转座子的数量和分布模式等不同的基因组结构造成的。
早期研究利用对甲基化敏感的限制酶构建了水稻日本晴和93-11的未分化悬浮细胞和幼嫩向光生长的茎尖的4号和10号染色体的着丝粒区高分辨DNA甲基化图谱。这些研究发现超过一半的蛋白质编码区的基因区和启动子区存在DNA甲基化修饰,并且甲基化优先发生在转录起始位点下游,和抑制基因转录相关。这个模式和拟南芥中只有CG甲基化存在于gene body区的模式很不同。
全基因组胞嘧啶甲基化图谱利用CpG甲基化免疫共沉淀测序解释了染色体上DNA甲基化的分布和水稻染色体上异染色质区的分布相似。基因对环境的响应往往受到DNA甲基化的调控。例如,干旱响应基因显著存在DNA甲基化修饰。此外,培矮64是一个光温敏雄性不育系,广泛用于水稻育种,在不育系中表现为全基因组超甲基化,在不同环境中存在非孟德尔的基因表达机制。全基因组分析水稻种子发育过程中DNA甲基化水平发现,非转座子基因有不同的甲基化修饰状态,说明在水稻籽粒发育过程中存在复杂的DNA甲基化模式调控机制。
利用重亚硫酸盐测序(BS-seq)发现水稻幼穗中24.3%的胞嘧啶是被甲基化修饰的,是拟南芥的四倍。同时发现CG、CHG、CHH胞嘧啶甲基化分别占44.5%、20.1%、4.0%,和水稻叶片甲基化组结果一致。CG甲基化在蛋白质编码区的gene bodies区水平较高,然而转座子、重复序列、着丝粒周围区域CG和non-CG甲基化水平都很高。此外,表达水平适中的基因容易被甲基化修饰,然而表达水平极高或者极低的基因不易被甲基化修饰。有趣的是,与亲本和非再生植株相比,水稻杂交种和再生植株表现出显著不同但可遗传的甲基化模式。这个结果可以推测水稻在组织培养和再生过程中,DNA甲基化在可以容易地被获得或者丢失 。在水稻胚乳中,低甲基化区域只发生在母本基因组上,可以形成印记基因,对于籽粒发育非常重要。此外,特别是利用生物信息学分析不同发育阶段和响应不同环境刺激的全基因组DNA甲基化修饰模式,将会为DNA甲基化的功能提供新的理解。
Key regulators of DNA methylation
在理解水稻DNA甲基化修饰机制方面取得了重要进展,包括鉴定多种酶通过不同或相似的方式从头建立和维持DNA甲基化。在水稻中,DNA甲基化主要通过small RNAs通过RdDM途径建立。OsDRM2(和拟南芥中的DRM2同源),在RdDM通路中起到从头甲基转移酶的作用,负责从头对水稻基因组中的CG和non-CG序列进行甲基化修饰。敲掉OsDMR2基因会同时影响营养生长和生殖生长,造成水稻半矮杆株型、分蘖数减少、推迟或不抽穗、不正常的穗和小穗表型、表现为完全不育,降低了近14%的DNA胞嘧啶甲基化修饰水平。有趣的是,OsDMR2的表达受到miR820的负调控。miR820是从一类从CACTA的DNA转座子转录而来。通过miR820来抑制OsDMR2的表达,造成转座子位点DNA甲基化水平降低,说明OsDMR2-miR820调控转座子和寄主基因组的相互作用。
作为最普遍的胞嘧啶甲基化类型,CG甲基化主由MET1基因维持,包括OsMET1a(OsMET1-1)和OsMET1b(OsMET1-2)。OsMET1b是维持CG甲基化的主要甲基转移酶,相比于OsMET1a它的表达更广泛、水平更高。相比于拟南芥met1突变体可以有育性,水稻OsMET1b突变体严重地影响籽粒的发育并导致幼苗死亡。相应的,甲基化组分析发现osmet1b突变体幼苗在全基因组水平上发生CG甲基化丢失,伴随改变对转座子、编码区、sRNAs以及可变剪切的调控。这项研究证明CG甲基化在水稻中起着重要、复杂的调控作用。
和CG甲基化类似,non-CG甲基化同样在植物中起到重要作用。水稻染色质甲基化酶OsCMT3a,一个植物特有的甲基转移酶,维持 non-CG(主要是CHG)的甲基化。OsCMT3a功能缺失突变体没有了对TEs和很多基因的抑制,诱导多向性的发育表型,尤其在生殖阶段。以上证据表明,相比于拟南芥,OsCMT3和OsDRM2在水稻的非CG甲基化和发育中起着更加重要的作用。在拟南芥中,drm1和drm2双突变体、cmt3单突变体均没有表型缺陷。这个表型可能是由于水稻和拟南芥基因组结构、不同基因组大小以及重复序列所处的环境不同导致的。相比于拟南芥基因组,水稻基因组的CG含量更高,并且从基因的5'到3'端CG含量下降。因为DNA甲基化转移酶是序列依赖性地发挥作用,因此高CG含量可能会增加胞嘧啶甲基化水平。重要的是,水稻基因组包含更高的异染色质区域,被不连续存在的TEs标记。因此,DNA甲基化转移酶会对水稻发育产生更加强烈的影响。相比于拟南芥,这可能是由于水稻中更多的TEs、重复序列被甲基化从而影响临近基因和重复基因的表达。
除了甲基化酶之外,DECREASE IN DNA METHYLATION 1 (DDM1),是一个SWI/SNF染色质重塑因子,对于维持胞基因组重复序列和TEs的胞嘧啶甲基化是必需的,因此参与维持水稻基因组的TE沉默。OsDDM1参与维持异染色质和常染色质区的CG、CHG甲基化以及常染色质区的CHH甲基化。然而,它抑制着丝粒区重复序列的CHH甲基化。
DNA胞嘧啶甲基化是被动态调控的,可以通过DNA复制而被动去除,也可通过去甲基化酶主动去除。在拟南芥中,DNA去甲基化由DNA glycosylases(DNA糖基化酶),如REPRESSOR OF SILENCING 1 (ROS1)可以防止内源基因和转入基因的超甲基化。DEMETER (DME)在胚乳基因组印记中起到重要作用。DEMETER-LIKE 2 (DML2) 和 DEMETER-LIKE 3 (DML3)负责去除位置错误的甲基化。水稻基因组编码了6个公认的5mC糖基化酶,4个与ROS1同源的酶(ROS1a、1b、1c、1d),和两个DML3同源酶(DML3a和DML3b)。DNA GLYCOSYLASE 701 (DNG701)也被称作ROS1c,是一个DNA糖基化酶。在愈伤组织中,相比于野生型,dng701敲除突变体变现为DNA超甲基化和T0S17转座频率降低。在愈伤组织中,过表达DNG701表现为降低DNA甲基化和Tos17的频繁转位,证明DNA甲基化对于抑制TEs起着关键作用。
HISTONE MODIFICATION
组蛋白N端尾巴的转录后修饰,如乙酰化、甲基化、磷酸化和泛素化在表观遗传调控中都有着重要的作用。翻译后修饰影响着更高级的染色质结构,从而调节不同的生物学过程,包括基因表达、DNA复制、对DNA损伤的响应以及细胞凋亡。组蛋白乙酰化和甲基化是两个重要的表观遗传标记,在很多综述中已被详细讨论过,并且在水稻的发育和基因组区域划分中行使着重要的功能。这里我们重点讨论全基因组组蛋白乙酰化和甲基化对于水稻发育的影响。
Histone acetylation
组蛋白赖氨酸乙酰化广泛地和转录激活相关,然而去乙酰化和转录抑制相关。水稻基因组编码了至少8个组蛋白乙酰化转移酶acetyltransferases (HATs)和18个组蛋白去乙酰化酶histone deacetylases (HDACs)。八个HATs被分为4类,CBP、TAFII250、GNAT(Gcn5-related N-acetyltransferases)和MYST(MOZ, Ybf2, Sas2, and Tip60)。此外,Song等鉴定到一个与粒重相关的QTL,它编码一个新型的GNAT-like HAT, OsglHAT1。过表达 OsglHAT1可以增加粒重、提高细胞数目、籽粒灌浆和全基因组水平组蛋白H4的乙酰化水平。其他HATs的生物学功能还有待阐明。
相比于水稻中很多功能未知的HATs,水稻HDACs已经被发现参与调控植物生长和发育,并且参与响应生物和非生物胁迫。水稻HDACs由3个家族构成:RPD3/HDA1,SIR2(SILENT INFORMATION REGULATOR 2)和HD2。下调OsHDA703表达会降低水稻花梗的延伸和受精,然而下调OsHDA704, OsHDA710,和 OsHDT702会造成营养生长时发育畸形。错误调节OsHDA702/OsHDAC1会改变生长速率,并通过表观遗传调控OsNAC6(控制根生长)的表达,进而导致茎尖和根组织的发育缺陷。OsHDT701属于HD2家族,通过降低PATTERN RECOGNITION RECEPTOR (PRR)和抗病相关基因的组蛋白乙酰化修饰水平负调控固有免疫。两个研究组分别独立发现敲低SIR2家族的OsSRT701/OsSRT1会提高TEs和一些与细胞死亡、胁迫以及代谢相关基因的H3K9乙酰化水平。此外,干旱胁迫显著诱导4种水稻HAT基因(OsHAC703, OsHAG703, OsHAF701, and OsHAM701)表达,然而一些HDAC基因被非生物胁迫调节。过表达OsHDT701增加水稻耐盐和抵抗渗透胁迫的能力。这些发现说明HATs和HDACs在水稻响应胁迫时发挥作用。
水稻全基因组组蛋白乙酰化分析发现64.9%的非TE基因被H3K9乙酰化修饰,主要富集在转录起始位点下游,并与基因表达激活有关。有趣的是,OsSRT1调节H3K9ac的稳定,并且靶向TEs,说明H3k9ac去乙酰化参与抑制TEs。H3K27ac是另一种组蛋白乙酰化标记,主要富集在基因区的转录起始位点下游,与H3K9ac位点高度一致。
Histone methylation
和组蛋白乙酰化不同的是,组蛋白赖氨酸甲基化提供特异的和独特的信号。H3K4和H3K36的甲基化和转录激活相关,然而H3K9和H3K27甲基化和转录抑制相关。
组蛋白赖氨酸甲基转移酶(HKMTS)包含一个SET(for Su(var)3-9, E(z), Trithorax)结构域。水稻基因组编码至少37个含有SET结构域的蛋白。SDG714(SET DOMAIN GROUP PROTEIN 714)是第一个在水稻中被鉴定到的HKMT蛋白,它特定催化组蛋白H3K9甲基化。下调表达SDG714表现为表皮毛(trichome)缺失,并且降低H3K9甲基化和Tos17的DNA甲基化,可以提高Tos17的转录和转座。这些发现证明SDG714在调节植物发育和维持基因组稳定性方面发挥着重要作用。相似的是,由SDG728介导的H3K9甲基化抑制Tos17和Ty1-copia元件的转录和转座。两个组蛋白H3K36甲基转移酶,SDG724和SDG725已经被发现可以通过去除MADS50 和 RICE FLOWERING LOCUS T1 (RFT1) 等几个与开花相关基因的H3K36me2/3修饰,从而促进开花。
通常来说,多梳蛋白 Polycomb group (PcG) proteins 通过催化H3K27甲基化从而抑制基因表达,然而 Trithorax group (TrxG) proteins 可以通过催化H3K4甲基化,从而维持基因的转录激活状态。PcG和TrxG蛋白在植物和动物中都是高度保守的。SDG723/OsTrx1是水稻中唯一被鉴定到的TrxG蛋白,是一个开花的激活子。The POLYCOMB REPRESSIVE COMPLEX 2 (PRC2)有4个核心蛋白,ENHANCER of ZESTE [E(z)], SUPPRESSOR of ZESTE 12 [Su(z)12], EXTRA SEX COMBS (ESC), 和p55。作为一个催化组件,包含SET结构域的E(z)介导H3K27me3。水稻基因组编码2个同源的E(z)(OsiEZ1/SDG718/OsSET1 and OsCLF/SDG711), 2个Su(z)12-like proteins [EMBRYONIC FLOWER 2a (OsEMF2a) and OsEMF2b], 和2个 ESC homologs [FERTILIZATION-INDEPENDENT ENDOSPERM 1 (OsFIE1) and OsFIE2]。与拟南芥中功能研究清晰的PRC2不同,水稻PRC2的许多功能还有待研究。水稻osemf2b 突变体存在多个缺陷,包括改变开花时间、花异常、以及完全不育,暗示OsEMF2b在水稻花发育过程中发挥关键作用。几个PRC2相关的成分参与控制水稻抽穗。比如,在水稻中,OsVIL2 通过抑制 OsLFL1 (LEAFY COTYLEDON 2 and FUSCA 3-LIKE 1) 诱导开花。OsiEZ1/SDG718/OsSET1 和 OsCLF/SDG711 参与调控水稻抽穗期。在已知的水稻PRC2成分中,OsFIE1是唯一的印记基因,它的母本等位基因在胚乳中表达,然而父本等位基因在胚乳中不表达。OsFIE1 是受温度调控的,并有表观修饰,包括DNA甲基化和H3K9me2。过表达OsFIE1 会造成OsFIE1 双等位基因表达,并且PRC2靶位点的H3K27me3发生异常。这导致多个发育缺陷,包括植株矮小、开花缺陷、以及种子变小,证明PRC2介导的H3K27me3在水稻发育中发挥着非常重要的作用。Tandem affinity-purified(串联亲和纯化)得到的OsFIE2-PRC2复合体,包括OsFIE2、OsCLF/SDG711、OsiEZ1/SDG718/OsSET1 和 OsEMF2b在体外表现为特异的H3甲基转移酶活性。这是首个证明水稻H3K27甲基转移酶复合体活性的报道。
组蛋白赖氨酸甲基化的平衡受到HKMTs和去甲基化酶的动态调节。两种组蛋白去甲基化酶,LYSINE-SPECIFIC DEMETHYLASE 1 (LSD1) 和 Jumonji C (JmjC) domain-containing proteins可以去除赖氨酸上的甲基化修饰。水稻基因组编码了3个LSD1同源蛋白和20个JmjC domain-containing proteins,但是LSD1蛋白的功能还不清楚。JMJ706可以在体外去除H3K9me2/me3,在体内去除H3K27me2/me3甲基化修饰,并且参与调控水稻花发育基因的表达。除了JMJ706、JMJ705可以去除H3K27me2/me3并且诱导激活水稻抗逆相关基因表达。JMJ703可以特异性去除H3K4me1/me2/me3的甲基化修饰,并且导致多个性状产生发育缺陷,影响了株高、二级分枝和籽粒大小等重要农艺性状。探索JMJ703靶定的特异性染色质区域并促进染色质高级修饰,进而调控水稻发育过程中的基因表达机制是十分有趣的。
水稻全基因组的H3K4甲基化修饰图谱表明超过一半的蛋白编码基因,不包括TEs,有H3K4me2或者H3K4me3修饰,高度符合H3K9ac的修饰pattern。H3K4me2水平和适中水平的基因表达呈正相关。与之相比,有H3K4me3修饰的基因是活跃转录的。这些修饰都倾向于发生在水稻基因的5'端(TSS下游),但是修饰水平峰值在不同的位置。这个模式证明了H3K4me3和H3K9ac可以被用来预测和证明注释不明确的水稻基因。例如,H3K4me3、H3K36me3在gene body区时,和激活基因表达相关,并且在调节特定等位基因表达中起到重要作用。H3K27me3作为一种抑制性修饰,发生在所有水稻gene bodies 的将近40%的非TEs基因上。这些位点的表达水平较低,并且有很强的组织特异性,和由PRC2复合体介导的H3K27me3的功能是一致的。
相比于以上描述的组蛋白修饰,H3K9甲基化是一个异染色质区的标记,对于抑制重复序列的表达是需要的。例如,着丝粒包含着串联重复卫星序列,由多个表观遗传修饰调节。蒋继明实验室开发了一种包含四种测序完成的水稻着丝粒的芯片,并利用ChIP-chip来定位H3K4me2、 H3K4me3、H3K36me3 和 H3K4K9ac四种常染色质修饰位点。他们发现这四种常染色质标记和水稻 着丝粒的基因区相关。例如,87.2%位于着丝粒区的含有4种组蛋白修饰标记的基因都可以转录,并且表达水平高的基因倾向于和四种组蛋白修饰标记相关。这显示水稻着丝粒区域存在与激活基因表达相关的常染色质亚区。
NON-CODING REGULATORY RNA
ncRNAs是重要的表观遗传调控子,并且包括sRNA和长片段非编码RNA(lncRNAs)。这些ncRNAs在植物发育过程中扮演着重要的角色,维持基因组的完整性,响应生物和非生物胁迫。在水稻中已经鉴定到许多个有功能的ncRNAs,它们参与了不同的生物学过程。这里我们总结了目前水稻miRNAs、siRNAs、lncRNAs的前沿研究结果,以及应用于调控水稻重要农艺性状的可能的策略。
MicroRNA
MiRNAs是一类长度为21~22nt,由茎环结构产生的单链RNA分子。miRNA在水稻和拟南芥中的合成途径是保守的。miRNA的发生因子的破坏会导致严重发育缺陷。说明miRNAs在水稻发育过程中起到重要的作用。植物miRNAs通过与靶mRNAs进行近乎完美的序列结合,并对其进行转录后切割。 在水稻中,一些non-canonical miRNAs可以通过RdDM途径诱导产生DNA甲基化。DNA甲基化常常与H3K9甲基化相关。结合5'RACE和生物信息学分析在不同组织和不同亚种中鉴定到一些水稻miRNAs的靶点,这极大促进了对于miRNAs生物学功能的研究。
一些研究已经在水稻中鉴定到许多miRNAs。截止目前(2016年),在水稻中已经有由592种前体产生的713种成熟的miRNAs被收录在miRBase 21.0中 (http://microrna.sanger.ac.uk/)。少数水稻miRNAs的靶标和功能被鉴定。其中,几种miRNAs被鉴定为重要农艺性状的关键调控元件。例如,miR156可以负调控SQUAMOSA (SQUA) PROMOTER-BINDING-LIKE (SPL)转录因子,SPL参与水稻和其他植物的许多生物学途径。两个独立研究揭示了