一文读懂LncRNA
RNA缩略词详解
lncRNA:长链非编码RNA(long non-coding RNA)
miRNA:微小RNA(microRNA)
circRNA:环状RNA(circular RNA)
ncRNA:非编码RNA(non-coding RNA)
tRNA:转运RNA(Transfer RNA)
rRNA:核糖体RNA(ribosomal RNA)
snRNA:小核RNA(small nuclear RNA)
snoRNA:小核仁RNA(small nucleolar RNA)
sncRNA:小分子非编码RNA(short ncRNA)
hnRNA:核内不均一RNA(heterogeneous nuclear RNA)
7SL:又名7S RNA,由RNA聚合酶III转录形成,通常为双链核糖核酸,是信号识别颗粒的支架
XIST:调控染色体结构的lncRNA
piRNA:与Piwi蛋白作用的RNA(Piwi-interacting RNA)
PART 01
LncRNA简介
LncRNA作为RNA三宝(miRNA、lncRNA和circRNA)之一,是一类长度超过200nt的非编码RNA分子,其缺乏开放阅读框(ORF),无编码蛋白质功能,迄今为止,国内外学者依然热衷于lncRNA的生物学功能研究。近5年来,lncRNA相关文章发表量直线上升,并依然可作为RNA功能研究的主力军。
过去众多不能翻译成蛋白质的ncRNA一度被认为是转录“垃圾”,然而随着高通量测序技术的兴起与发展以及“DNA元件百科全书计划”的推动,从发现tRNA、rRNA等开始,具有生物学作用的ncRNA已有多年历史(Palazzo et al., 2015)。一方面,管家ncRNA包括rRNA、tRNA、snRNA和snoRNA,通常以组成型形式发挥功能。另一方面,基于ncRNA转录本长度,将其分为<200nt的sncRNA以及>200nt的lncRNA等,这些ncRNA包含丰富的调节和功能单元,其中lncRNA占比较大,即大多数转录但不编码蛋白的序列均与lncRNA相关,从此ncRNA从“垃圾”中除名。目前,已从单细胞真核生物以及人类中鉴定出数以万计的lncRNA基因座,并依据其相对于蛋白质编码基因的相对位置,将其分为以下5类(Wilusz et al., 2009)。
(1)基因间lncRNA(intergenic lncRNA,lincRNA):从两个蛋白质编码基因之间的DNA序列转录;
(2)内含子lncRNA(intronic lncRNA):从蛋白质编码基因的内含子转录;
(3)正义lncRNA(sense lncRNA):转录方向与蛋白质编码基因方向相同;
(4)反义lncRNA(antisense lncRNA):转录方向与蛋白质编码基因方向相反;
(5)双向lncRNA(bidirectional lncRNA):与蛋白质编码基因共享相同的启动子,但转录方向相反。
表1 哺乳动物细胞中总RNA含量比较(Palazzo et al., 2015)
image注:未剪接的pre-mRNA的大小平均为17kb;然而,大多数pre-mRNA都是被部分剪接的,因此hnRNA平均大小约为10kb。
大量实验证实,lncRNA与人类疾病的发生发展密不可分,可在表观遗传、顺式或反式转录及转录后水平上调控基因表达,参与X染色体沉默、基因组印记以及染色质修饰、转录激活、转录干扰、核内运输等生物学进程,但经实验鉴定的与疾病相关的lncRNA数量仅为已鉴定基因座的1%不到,其生物学功能有待进一步挖掘(Quek et al., 2015)。
PART 02
LncRNA的生物发生和细胞命运
广泛的lncRNA涵盖了大量生物发生与基因组起源均不同的高度异质化转录本,主要有RNA聚合酶II(Pol II)转录的lncRNA、其他RNA聚合酶转录的lncRNA等,并可通过5'端加冒(7-甲基鸟苷(m7G))、3'端聚腺苷酸化(polyA)形式发生类似于mRNA的剪接(Statello et al., 2021)。然而,近几年的研究已揭示了lncRNA独特的转录、加工、输出,这与它们的细胞命运和功能密切相关。
(1)LncRNA的转录和加工
与mRNA不同的是,许多lncRNA被无效处理并定位于细胞核(Guo et al., 2020)。对lncRNA和mRNA整体特征的分析表明,lncRNA基因进化保守性较低,外显子较少,表达量较低(Lagarde et al., 2017)。首先,Pol II羧基末端结构域的磷酸化状态对应着不同的转录阶段,而磷酸化失调的Pol II转录了很大一部分lncRNA,但由于其与聚腺苷酸化信号无关,导致这些lncRNA在染色质上暂时积累,随后被RNA外泌体迅速降解(Schlackow et al., 2017);其次,一些染色质定位的lncRNA包含高水平的U1 snRNA结合位点,这些结合位点募集了U1小核核糖核蛋白(U1 snRNP),进而参与了Pol II介导的转录,最终导致许多lncRNA束缚在染色质上;最后,某些剪接调节子的差异表达,也有助于lncRNA在细胞核中的积累,并且lncRNA中的其他聚腺苷酸化信号亦可调节其亚细胞定位情况,导致lncRNA核积累。
(2)LncRNA的输出定位
大多转录后的lncRNA可输出到细胞质,这些lncRNA可能与mRNA共享相同的加工和输出途径。最近的一项研究表明,由于lncRNA与mRNA相比具有更少的外显子,因此,带有一个或仅有几个外显子的长且富含A/U的lncRNA转录本会优先选择核RNA输出因子1(NXF1)途径(Zuckerman et al., 2020)。当其到达细胞质后,lncRNA将经历特定的分选过程,将不同的lncRNA分配给特定的细胞器,或者分布在细胞质中并与各种RNA结合蛋白(RBP)结合。据统计,在多聚核糖体中发现了近一半的细胞质lncRNA,这可能是由于,某些顺式元件促进了lncRNA与核糖体的结合,并且核糖体相关lncRNA的降解可通过翻译依赖性机制触发(Carlevaro-Fita et al., 2016)。但核糖体相关lncRNA是否参与了核糖体的翻译进程,其在翻译过程中发挥怎样的作用还有待进一步探索。
此外,人类线粒体转录组分析显示,从细胞核输出的lncRNA还可定位于线粒体(Mercer et al., 2011)。例如:lncRNA RMRP到达线粒体后,会被富含G的RNA序列结合因子1(GRSF1)结合并稳定,从而使其在线粒体基质上积聚(Noh et al., 2016);人类血液外泌体的RNA测序结果表明,其中包括许多lncRNA,但目前尚不清楚lncRNA是如何定位到外泌体的,猜测其可能涉及RBP结合特定序列基序(Gudenas et al., 2018)。
image图1 LncRNA的生物发生和细胞命运。a. lncRNA的生物学发生。b-e:lncRNA核保留机制。b. 失调Pol II转录的lncRNA保留在染色质上被核外泌体降解;c.具有U1 snRNA结合基序的lncRNA招募U1 snRNP后与不同位点的Pol II关联;d. 许多lncRNA的3’端与分支点之间的长序列以及比mRNA短的多聚嘧啶(PPT),导致其低效率剪接;e. 顺式作用元件与反式作用元件的协同作用利于lncRNA核定位。f-i:LncRNA细胞命运。f. 细胞质中lncRNA通常与各种RBP相互作用;g. 细胞质中lncRNA通过“假”5'UTR与核糖体相关;h. lncRNA通过未知的机制被分类为线粒体;i. 其他细胞器中的lncRNA,例如外泌体。
注:“假”5'UTR即位于lncRNA假ORF之前的长序列。
PART 03
LncRNA相关功能
考虑到越来越多的胞质lncRNA在调节mRNA稳定性、翻译、信号传导途径中起着重要作用,下面伯小远将针对lncRNA生物学功能进行详细说明。
image图2 LncRNA分子机制示意图。1. 上游非编码启动子(橙色)转录可以是正向或负向;2. 通过抑制RNA聚合酶II的募集或诱导染色质重构,影响下游基因表达(蓝色);3. 反向转录(紫色)能够与重叠的正向转录(蓝色)结合,阻断剪接体对剪接位点的识别,形成选择性剪接转录;4. 正向和反向转录结合,Dicer产生内源性siRNA;5. 结合特定的蛋白质伴侣,非编码转录(绿色)调节蛋白质活性;6. 作为一种结构成分,利于形成更大的RNA蛋白质复合物;7. 改变蛋白质在细胞中的定位;8.经加工生成各类小RNA。
(1)LncRNA作为转录调节因子(Ponting et al., 2009)
上文提到lncRNA可以以顺式作用元件(cis)或反式作用元件(trans)的形式发挥作用,这意味着它们不仅可通过多种机制调节自身转录位点附近的基因表达(cis功能),还可通过靶向远处的转录激活因子或阻遏物调控基因组表达或影响基因在细胞中的定位情况(trans功能)。具体作用如下图所示。
image图3 LncRNA作为转录调节因子示意图。A. 影响转录;B. 参与染色质重塑;C. 影响启动子活性;D. 辅助激活蛋;E. 激活转录因子;F 促进蛋白寡聚化;G. 调控转录因子;H. 参与表观遗传;I. 反式lncRNA抑制表观遗传。
注:lncRNA为蓝色,编码蛋白的基因为粉红色,启动子/增强子元件为浅粉红色,蛋白为橙/黄色。
(2)染色质调节
染色质构象捕获技术结合RNA-染色质关联检测,揭示了复杂的lncRNA调控染色质结构和基因表达调控网络(Mumbach et al., 2019)。RNA的负电荷可以中和带正电荷的组蛋白尾部,导致染色质去致密化,从机制上讲,cis和trans核lncRNA都可与DNA建立相互作用以改变染色质环境。具体作用如下:
① 蛋白质-lncRNA在染色质上的定位和功能
大量定位在染色质上的lncRNA可与蛋白质相互作用,发挥促进或抑制蛋白质在目标DNA区域的结合活性作用;且需蛋白质辅助的远程染色质互作(如CCCTC结合因子(CTCF)介导的染色质相互作用),可作为lncRNA对靶基因转录作用的直接促进因子(Saldana-Meyer et al., 2019) (如图4a, b)。虽然lncRNA与染色质因子的结合引起了相当大的兴趣,但评估这种相互作用需使用严格方法。
② LncRNA与DNA之间的直接相互作用
LncRNA的一个基本特征是它们有可能与DNA产生杂交结构,从而影响染色质可接触性。这种相互作用可以采用三螺旋或R-loop形式,由于两种结构的体内检测具有一定难度,这两种结构的实际流行程度仍然未知,尽管如此,lncRNA的调节可能普遍且必不可少的参与了两种结构的形成。RNA-DNA-DNA三螺旋体已被作为ncRNA-DNA在介导基因沉默或激活中相互作用的一个例子(O'Leary et al., 2015),最近,已开发出TrIP-seq(靶向RNA免疫沉淀测序)来研究体内三螺旋体形成序列。而发生在R-loop上的相互作用,长期以来一直被认为是对基因组稳定性的威胁,但近期研究表明,几种lncRNA可在R-loop背景下调节基因表达,导致广泛结果,并且形成R-loop的lncRNA不仅以cis结构调节蛋白质编码基因的表达,也以trans结构发挥该功能(如图4c)。
image图4 LncRNA介导的染色质调控。a. LncRNA可与染色质修饰因子相互作用并将其招募到靶基因启动子上,以激活或抑制其cis转录或远处trans转录;b. LncRNA可作为特定染色质修饰物的诱饵,将它们与靶基因启动子隔离;c. LncRNA可与DNA相互作用,并通过转录形成RNA-DNA混合体(例如R-loop),可通过激活或抑制靶基因转录的染色质修饰物或转录因子进行识别。
(3)在核组织中的作用
核凝聚物参与许多细胞中无膜RNA-蛋白质的隔离,介于lncRNA的支架或调节活性,其对不同核凝聚物的形成及功能发挥是必不可少的(Banani et al., 2017)。例如,NEAT1对核旁副核(直径约0.36μm)的形成至关重要,其可螯合大量副核蛋白,形成高度有组织的核—壳球形核体,NEAT1的中间区域位于副核中心,3’和5’区域位于边缘,不同的副核蛋白被NEAT1嵌入核心区域(NONO),与FUS、剪接因子,富脯氨酸、谷氨酰胺或RBM14的球状结构相融合。
(4)在转录后调控中的作用
① LncRNA-蛋白质直接相互作用的模式
LncRNA参与转录后调控,通过与RNA序列基序或结构结合,形成特定的lncRNA蛋白复合物(lncRNPs),导致mRNA剪接和转录的改变,并在某些生物学环境中调节信号通路(图5A)。LncRNA介导的剪接调控机制还包括lncRNA调节剪接因子的翻译后修饰,即通过与目标前mRNA形成RNA-RNA杂交体来抑制剪接,以及通过染色质重塑微调目标基因剪接(Romero-Barrios et al., 2018)。另有文献表明,lncRNA还可折叠成与关键信号通路中涉及的蛋白质相互作用的结构,以激活或抑制信号通路,但非经典RBP蛋白如何与lncRNA相互作用的具体机制仍有待探索。
② 与其他RNA配对以招募蛋白质复合物
一些lncRNA可直接与其他RNA碱基配对,随后招募参与mRNA降解的蛋白质(图5B)。值得注意的是,trans-lncRNA正在成为重要的转录后调节因子,未来的研究不仅需要鉴定lncRNA功能以更好地剖析单个lncRNA-蛋白质相互作用的分子基础,还需要揭示不同lncRNP之间的机制共性。
③ 充当miRNA“sponges”
miRNA“sponges”即miRNA分子海绵,又名内源性竞争RNA(competing endogenous RNA,ceRNA)机制,一些含有miRNA互补位点的lncRNA可以作为ceRNA调节基因表达,从而降低miRNA对mRNA的靶向作用(图5C)。潜在的竞争内源lncRNA和miRNA之间的化学计量关系是对后续靶mRNA表达的可测量效果尤为重要。该机制曾一度风靡肿瘤研究领域,现如今,该机制已在神经、肌肉、心血管、脂肪、造血、免疫系统等众多人类疾病中得以探索。
image图5 LncRNA在转录后调控中的作用。A. trans-lncRNA通过序列基序或形成独特的结构基序与RBP相互作用:Aa. PNCTR将PTBP1-PNC蛋白复合体解离,从而抑制PTBP1介导的核质中其他部位的mRNA剪接;Ab. 在细胞质中,由NORAD激活的非编码RNA可解离PUM RBP,干扰PUM对其靶标mRNA的功能;Ac.* FAST可形成几个结构模块,通过结合β-TrCP,阻止其底物β-cat降解,激活人类胚胎干细胞中WNT信号通路。B. trans-lncRNA通过碱基配对,直接与RNA相互作用:Ba. TINCR或1/2-sbsRNAs可通过形成STAU1分子间双链体,分别促进或抑制mRNA稳定性;Bb. AS-Uchl1互补结合Uchl1* mRNA,促进Uchl1翻译进展。C. LncRNA通过充当ceRNA来影响基因表达:如,lncRNA-PNUTS由hnRNPE1对PNUTS pre-mRNA选择性剪接产生,其包含七个miR-205结合位点,降低miR-205与ZEB1、ZEB2 mRNA结合。
(5)LncRNA的细胞器调节功能
有趣的是,许多lncRNA定位于特定的细胞器,例如外泌体和线粒体。由于外泌体被定期释放到细胞外环境中,因此,外泌体定位的lncRNA可被分泌并最终进入受体细胞,在受体细胞中,这种lncRNA可参与表观遗传、细胞类型重编程和基因组不稳定性调控;而线粒体定位的lncRNA可由核DNA和线粒体DNA编码,通常与线粒体代谢、细胞凋亡以及线粒体与细胞核的串扰相关(Statello et al., 2021)。目前已知,核编码的lncRNA SAMMSON可调控线粒体稳态,影响线粒体16S核糖体RNA的成熟,以及调节线粒体编码的多肽的表达(Leucci et al., 2016)。但更多细胞器特异性lncRNA功能及分子机制有待进一步挖掘。
PART 04
LncRNA研究套路
虽然lncRNA功能如此之庞大,但其也有一套常用的研究套路,伯小远经众多已发表文献的整理与阅读,将lncRNA研究套路总结为以下几步:目标lncRNA筛选、研究方向初断、lncRNA表达和定位、lncRNA功能性研究、lncRNA分子及作用机制探究、lncRNA临床分析。
1、如何借助数据库,进行目标lncRNA的筛选?
1)若对lncRNA没有预期目标,则可进行lncRNA测序(即全转录组测序)或lncRNA芯片,与普通mRNA测序不同的是,lncRNA测序是通过rRNA去除,对含有polyA结构和不含polyA的RNA一同富集并建库测序,这种策略能够鉴定到更多的lncRNA,并且能够与mRNA同时进行分析,更有利于推测lncRNA可能的调控途径。LncRNA芯片也同时包含mRNA和lncRNA探针,这两种方式已成为目前最主流的高通量筛选lncRNA的手段;
2)若对lncRNA已有初步目标,则可通过查看现有lncRNA公共数据库,检索初步目标是否显著差异,同时,通过临床信息,分析其与患者生存率的关系;
3)若已确定其下游靶基因,则可通过在线网站预测、基因调控通路富集(GO分析、KEGG分析)等手段,反推相互作用的lncRNA;
4)若已知某lncRNA在疾病模型组织中特性表达,则证明该lncRNA具有很好的后续研究价值;
5)为减小后续引物设计、细胞转染等实验的操作难度,建议筛选的目标lncRNA长度在1000-5000nt之间;
6)为确保后续表达量检测的准确性,建议所选lncRNA的本底表达水平在中等偏上。
2、选定目标lncRNA后,又该如何确定研究方向?
1)进一步对上述测序、公共数据库等数据进行生物信息学分析,预测推断其上下游的调控方向;
2)大量的文献阅读,判断目标lncRNA的研究价值;
3)条件允许,可进行相应细胞的预实验,判断该研究方向的可行性。
3、为探索目标lncRNA的具体生物学功能与作用机制,以及其临床疾病的关联性,建议进行以下研究。
1)由于lncRNA的定位不同,其生物学功能有所差异,若尚不清楚目标lncRNA的定位情况,可通过亚细胞定位等实验确定,同时,通过RT-qPCR等实验验证其表达水平;
2)功能获得性研究:构建目标lncRNA过表达载体,观察细胞/动物模型相关表型变化;
3)功能缺失性研究:利用RNAi、CRISPR/Cas等技术构建目标lncRNA的siRNA或敲低与敲除载体,观察细胞/动物模型相关表型变化;
4)敲低/敲除目标lncRNA后,通过亚细胞定位等实验分析其附近基因的表达,若表达出现差异,则说明该lncRNA为cis元件,反之则为trans元件;
5)为验证lncRNA与其他物质结合形成的复合物参与调控一系列生物学进程,后续可通过RNA pull-down、ChIRP、RIP、ChIP-seq等技术研究目标lncRNA的作用机制;
6)条件允许情况下,可对临床样本进行RT-qPCR、免疫组化、免疫荧光等检测,并收集整合患者临床数据,以分析目标lncRNA与疾病分期、复发、转移的关系以及预后相关性。
PART 05
伯小远总结
imageReferences
[1] Banani, S. F., Lee, H. O., Hyman, A. A., et al. (2017). Biomolecular condensates: organizers of cellular biochemistry. Nat Rev Mol Cell Biol, 18(5), 285-298.
[2] Carlevaro-Fita, J., Rahim, A., Guigo, R., et al. (2016). Cytoplasmic long noncoding RNAs are frequently bound to and degraded at ribosomes in human cells. RNA, 22(6), 867-882.
[3] Gudenas, B. L.,Wang, L. (2018). Prediction of LncRNA Subcellular Localization with Deep Learning from Sequence Features. Sci Rep, 8(1), 16385.
[4] Guo, C. J., Ma, X. K., Xing, Y. H., et al. (2020). Distinct Processing of lncRNAs Contributes to Non-conserved Functions in Stem Cells. Cell, 181(3), 621-636 e622.
[5] Lagarde, J., Uszczynska-Ratajczak, B., Carbonell, S., et al. (2017). High-throughput annotation of full-length long noncoding RNAs with capture long-read sequencing. Nat Genet, 49(12), 1731-1740.
[6] Leucci, E., Vendramin, R., Spinazzi, M., et al. (2016). Melanoma addiction to the long non-coding RNA SAMMSON. Nature, 531(7595), 518-522.
[7] Mercer, T. R., Neph, S., Dinger, M. E., et al. (2011). The human mitochondrial transcriptome. Cell, 146(4), 645-658.
[8] Mumbach, M. R., Granja, J. M., Flynn, R. A., et al. (2019). HiChIRP reveals RNA-associated chromosome conformation. Nat Methods, 16(6), 489-492.
[9] Noh, J. H., Kim, K. M., Abdelmohsen, K., et al. (2016). HuR and GRSF1 modulate the nuclear export and mitochondrial localization of the lncRNA RMRP. Genes Dev, 30(10), 1224-1239.
[10] O'Leary, V. B., Ovsepian, S. V., Carrascosa, L. G., et al. (2015). PARTICLE, a Triplex-Forming Long ncRNA, Regulates Locus-Specific Methylation in Response to Low-Dose Irradiation. Cell Rep, 11(3), 474-485.
[11] Palazzo, A. F.,Lee, E. S. (2015). Non-coding RNA: what is functional and what is junk? Front Genet, 6, 2.
[12] Ponting, C. P., Oliver, P. L.,Reik, W. (2009). Evolution and functions of long noncoding RNAs. Cell, 136(4), 629-641.
[13] Quek, X. C., Thomson, D. W., Maag, J. L., et al. (2015). lncRNAdb v2.0: expanding the reference database for functional long noncoding RNAs. Nucleic Acids Res, 43(Database issue), D168-173.
[14] Romero-Barrios, N., Legascue, M. F., Benhamed, M., et al. (2018). Splicing regulation by long noncoding RNAs. Nucleic Acids Res, 46(5), 2169-2184.
[15] Saldana-Meyer, R., Rodriguez-Hernaez, J., Escobar, T., et al. (2019). RNA Interactions Are Essential for CTCF-Mediated Genome Organization. Mol Cell, 76(3), 412-422 e415.
[16] Schlackow, M., Nojima, T., Gomes, T., et al. (2017). Distinctive Patterns of Transcription and RNA Processing for Human lincRNAs. Mol Cell, 65(1), 25-38.
[17] Statello, L., Guo, C. J., Chen, L. L., et al. (2021). Gene regulation by long non-coding RNAs and its biological functions. Nat Rev Mol Cell Biol, 22(2), 96-118.
[18] Wilusz, J. E., Sunwoo, H.,Spector, D. L. (2009). Long noncoding RNAs: functional surprises from the RNA world. Genes Dev, 23(13), 1494-1504.
[19] Zuckerman, B., Ron, M., Mikl, M., et al. (2020). Gene Architecture and Sequence Composition Underpin Selective Dependency of Nuclear Export of Long RNAs on NXF1 and the TREX Complex. Mol Cell, 79(2), 251-267 e256.