生物信息学文献资料整理或解读转录组研究

LncRNA 概述

2019-03-27  本文已影响275人  Ray钱

一、lncRNA的研究背景

表观遗传学是研究基因表达发生了可遗传的改变,而DNA序列不发生改变的一门生物学分支,对细胞的生长分化及肿瘤的发生发展至关重要。表观遗传学的主要机制包括DNA甲基化、组蛋白修饰及新近发现的非编码RNA。非编码RNA是指不能翻译为蛋白的功能性RNA分子,其中常见的具调控作用的非编码RNA包括小干涉RNA、miRNA、piRNA以及长链非编码RNA。研究者的大量研究表明非编码RNA在表观遗传学的调控中扮演了越来越重要的角色。

在近十余年的生命科学研究中非编码调控RNA可谓是研究最火的领域之一,从2006年诺奖的siRNA,到这几年异常火爆的microRNA,到即将登场并定能风靡的lncRNA,可谓如火如荼。RNA不仅仅只承担遗传信息中间载体的辅助性角色,而是更多地承担了各种调控功能。

lncRNA在发育和基因表达中发挥的复杂精确的调控功能极大地解释了基因组复杂性之难题,同时也为人们从基因表达调控网络的维度来认识生命体的复杂性开启新的天地。研究者大部分研究集中于短 RNA如 microRNA,piRNA 等一些 ncRNA 生物生成机制和调控通路,甚至在一些人类复杂疾病中的功能,但是这都只是冰山一角。人们对lncRNA(Long noncoding RNAs,lncRNAs)的认识还处在初级阶段,lncRNA起初被认为是基因组转录的“噪音”,是RNA聚合酶II转录的副产物,不具有生物学功能。然而,有文献研究表明,lncRNA参与了X染色体沉默、基因组印记以及染色质修饰、转录激活、转录干扰、核内运输等多种重要的调控过程。lncRNA的这些调控作用也开始引起人们广泛的关注。

哺乳动物基因组序列中,4%~9%的序列产生的转录本是lncRNA(相应的蛋白编码RNA的比例是1%)。虽然关于lncRNA的研究进展迅猛,但是绝大部分的lncRNA的功能仍然是不清楚的,随着研究的推进,各类lncRNA 的大量发现,lncRNA 的研究将是RNA 基因组研究非常吸引人的一个方向,使人们逐渐认识到基因组存在人类知之甚少的“暗物质”。

近年来lncRNA得到了研究界的广泛关注,人们已经在测序技术的帮助下鉴定了大量lncRNA,但lncRNA的生物学功能依然迷雾重重。

西班牙IMIM(Hospital del Mar Medical Research Institute)和加泰罗尼亚理工大学(UPC)的研究团队最近在eLife杂志上发表研究指出,长非编码RNA在新蛋白演化中起到了重要的作用,它们在细胞中有着不为人知的重要功能。长非编码RNA是指长度超过三百个核苷酸的RNA分子,其上没有编码蛋白的阅读框。在细胞内lncRNA的丰度约占到70%至98%,有些lncRNA甚至长达几千bp。虽然lncRNA没有编码任何蛋白质,但它们的表达在不同组织和发育阶段依然具有特异性,这说明lncRNA具有重要的生物学意义。绝大多数lncRNA位于细胞核,它们对应的DNA区域有的与蛋白编码基因重叠,有的位于基因之间或者内含子中。由于lncRNA似乎没有承担什么生物学功能,它们曾被认为是一种“进化噪声”。现在西班牙的研究人员通过新测序技术向人们展示,许多这样的转录本也有机会翻译成为蛋白。这一发现旋即引起了激烈的争论。

Mar Albà等人在六个物种中(人类、小鼠、鱼、果蝇、酵母和一种植物)验证了这一结果,许多lncRNA与核糖体关联,似乎随时准备翻译成为蛋白。这说明,lncRNA可以成为新蛋白合成的资源。这项研究显示,大多数lncRNA是种系特异性的,很少有lncRNA存在于两个以上的物种中。由此可见,这些lncRNA很可能是最近才演化出来的。事实上,lncRNA分子表现出许多与“年轻”基因相似的特性。新功能性蛋白的出现,是一个反复尝试的过程。因此细胞需要生成大量的转录本,这些转录本不一定都能通过时间的检验。lncRNA与这样的转录本很相符。对近亲物种进行研究,将有助于我们进一步理解新基因的形成机制,鉴定那些可能有功能的转录本。lncRNA表达模式改变与特定疾病的关联,也是一个很有吸引力的研究方向。

二、lncRNA的作用机制

随着lncRNA功能逐步显现,其与靶点的作用机制成为进一步的热点。早期认为原位调控是lncRNA 作用的唯一机制,它通过招募形成染色质修饰复合物而沉默邻近基因转录,例如IGF2R 反义RNA(antisense of IGF2R RNA,AIR)、XIST 等。而Hox 基因反义基因间RNA(Hox antisense intergenicRNA,HOTAIR)的发现提示lncRNA可能存在远程调控。

同源异型基因(homeotic genes,HOX)在细胞增殖与定向分化中起关键作用,人类Hox 基因簇约含100个ncRNA 基因,其中HOTAIR 定位于HOXC 基因座12q13.13。HOTAIR的5'端可招募结合多梳蛋白抑制复合物2(polycomb repressivecomplex 2,PRC2),借助PRC2上三个H3K27甲基化酶EZH2、SUZ12和EED,使另一基因座HOXD上长约40 kb的序列转录沉默,从而在乳腺上皮细胞内使细胞内转录倾向于胚胎成纤维细胞样表型。超过20%的lncRNA 能够通过结合PRC2或其他类似复合物发挥作用,提示lncRNA的远程调控机制在生物体内广泛存在。

长链非编码RNA的作用机制非常复杂,至今尚未完全清楚。根据目前的研究,lncRNA的作用机制如要有以下几种。

(1)编码蛋白的基因上游启动子区(橙色)转录,干扰下游基因(蓝色)的表达;

(2)抑制RNA聚合酶II或者介导染色质重构以及组蛋白修饰,影响下游基因(蓝色)的表达;

(3)与编码蛋白基因的转录本形成互补双链(紫色),干扰mRNA的剪切,形成不同的剪切形式;

(4)与编码蛋白基因的转录本形成互补双链(紫色),在Dicer酶的作用下产生内源性siRNA;

(5)与特定蛋白质结合,lncRNA转录本(绿色)可调节相应蛋白的活性;

(6)作为结构组分与蛋白质形成核酸蛋白质复合体;

(7)结合到特定蛋白质上,改变该蛋白质的细胞定位;

(8)作为小分子RNA(如miRNA、piRNA)的前体分子。

图1  LncRNA作用机制

目前,发现的参与哺乳动物基因活动的lncRNA已有上千个,其调控基因表达的机制存在共性。一般来说,lncRNA主要从表观遗传学、转录调控及转录后调控等3个层面实现对基因表达的调控。

图2 LncRNA在3个层面上实现对基因表达的调控

表观遗传调控

哺乳动物lncRNA介导的表观遗传改变的研究,最早源于基因组印记(genomic printing)和X染色体失活(X chromosome inactive)两个方面,分别与H19和X ist RNA密切相关。近十年研究证实,lncRNA与表观遗传调控密切相关,并且发现了许多新的与基因调控有关的lncRNA。

转录调控

图3 lncRNAs转录调控作用机制

LncRNA能够通过多种机制在转录水平进行调控,表现在如下几个方面。

LncRNA的转录可以干扰邻近基因的表达。例如,酵母的SER3基因受到上游一段lncRNA——SRG1的干扰。近端启动子转录的lncRNA可将RNA结合蛋白定位至基因启动子区域从而调控基因表达。如,人类细胞中的细胞周期蛋白D1(CCND1)的表达,DNA损伤信号诱导该基因启动子上游一段lncRNA的表达,它可调节RNA结合蛋白——TLS的活性,接着TLS抑制CREB结合蛋白——组蛋白乙酰基转移酶和p300的活动,进而使CCND1基因的表达沉默。

LncRNA可作为共因子调节转录因子的活性。例如,小鼠的一段lncRNA——Evf2转录自一段超保守的远端增强子,它可与转录因子DLX2形成转录复合体,并结合至一个增强子上,从而诱导邻近蛋白编码基因DLX6的表达。通过与影响启动子选择的抑制性复合物相互作用,封锁启动子区域来调控RNA聚合酶(RNAP)II的活动从而干扰基因表达。这可能是存在于真核细胞染色体上的上千种三倍体复合物结构控制启动子作用的普遍机制。

再如,小鼠17号染色体的Igf2r区是第一个被证实的可转录为 lncRNA的位点,父系染色体上一未拼接的 lncRNA——A irn从母源性Igf2r上的ICR区域开始转录,方向与Igf2r相反。这一反义链转录的RNA规模较大,跨越整个Igf2r启动子。并越过基因间区抵达邻近基因。属于一种转录干扰机制。

转录后调控

图4 lncRNAs转录后调控作用机制

LncRNA在转录后水平可与mNRA形成双链RNA复合物,以掩盖mRNA的主要顺式作用元件,从而调控基因表达。例如,lncRNA-Zeb2(即Sip1)能够和HOX位点转录的mRNA的一个内含子的5’端剪切位点形成双链,从而防止该内含子被剪切。该区域含有对于Zeb2蛋白表达所必须的核糖体结合位点,Zeb2通过这种方式能够提高Zeb2蛋白的表达量。这一例子说明lncRNA可以指导mRNA亚型的选择性剪接。

另外,lncRNA的复性(退火)具有靶向作用,使蛋白受体复合物能够识别正义链mRNA转录本。这一租用类似于RNA诱导的沉默复合物(RISC)通过siRNA靶向作用于mRNA。来自于互补转录本甚至是lncRNA的双链RNA,结合延长的内部发夹结构,能够被加工成内源性siRNA以使基因表达沉默。

上一篇下一篇

猜你喜欢

热点阅读