生信分析工具包

如何理解circRNA

2020-01-22  本文已影响0人  因地制宜的生信达人

我前面提到过,如果你确实是第一次接触circRNA芯片数据,完全不用担心, 你只需要把它看作是你不知道基因名字的mRNA芯片,最后得到的各种各样的分析结果,只不过是以circRNA的ID来表示而已。

虽然是一个ID,但是也是需要理解的,这里我们仍然是以发表在Cancer Cell International,时间是 November 2019 ,标题是: A 3-circular RNA signature as a noninvasive biomarker for diagnosis of colorectal cancer的文章来举例。

首先看两个circRNA基因结果示意图

一般描述:Circular RNAs (circRNA) originate from back-splicing events, which link a downstream 5' splice site to an upstream 3' splice site.

从示意图可以看到,具体的circRNA都是在基因内部的一些外显子连接起来了,就是所谓的环化!而这个基因就是具体的circRNA的host gene啦。

然后看看circRNA的host gene

circRNA虽然只有ID,但是它是有host gene的,这样的话,也就是以host gene作为媒介,从而进行数据库注释啦。

值得注意的是,并不是所有的circRNA都是在基因上面哦。

更丰富的circRNA种类

这个时候,我们看另外一个文献,发表在J Transl Med. 2018 Dec 的:Circular RNA regulatory network reveals cell-cell crosstalk in acute myeloid leukemia extramedullary infiltration.

对circRNA的注释就更丰富了,circRNA检测的基本原理是去识别反向剪切的位点(backsplice),最主要的circRNA类型是外显子来源的。当然,在内含子、间区、UTR区域、lncRNA区域以及已知转录本的反义链区域也都鉴定到circRNA,同一个位点可能形成多个circRNA,每个circRNA可能包含一个或多个外显子。

那些并不在基因上面的circRNA比例并不多哦,它们就没有host gene

circRNA形成的3种方式

circRNA产生方式包括外显子环化和内含子环化。

参考DOI: 10.13213/j.cnki.jeom.2017.17415

circRNA的3大功能

circRNA 具有稳定并且广泛的 表达,在特定类型的细胞或组织中有特异性表达。 circRNA主要有3个功能,包括

参考DOI: 10.13213/j.cnki.jeom.2017.17415

circRNA的这些功能决定着如何使用它进行科研课题设计。

收集整理好的circRNA相关数据库

  1. Circbase (http://cirbase.org/
    这个数据库收集了几千条在真核细胞表达的 circRNAs,是个公共 circRNA 数据集, 有相应 circRNA 详细信息,还可以下载 circRNA 序列。
  2. CIRCpedia v2 http://www.picb.ac.cn/rnomics/circpedia/
    CIRCpedia v2 是一个更新的综合数据库,包含来自 6 个不同物种的 180 多个 RNA-seq 数据集共 262782 条的 circRNA 注释。该数据库允许用户搜索、浏览和下载具有各种细胞类型/组织(包括疾病样本)表达特征的环状 rna。
    此外,更新后的数据库包含了人类和小鼠之间环状 rna 的保守性分析。
    3.Circular RNA Interactome (http://circinteractome.nia.nih.gov/Circular_RNA/circular rna.html)
    该数据库预测了已知的 109 个 RNA 结合蛋白数据集与 circbase 中的 circRNA 的结合位点,并利用 Targetscan 软件预测了 miRNAs 与 circRNA 的潜在结合位点。此外, 该数据库还可以用于设计环状 RNA 引物, 针对环状 RNA 的 siRNA。
  3. circRNADb (http://202.195.183.4:8000/circrnadb/circRNADb.php)
    首个汇总编码蛋白环状 RNA 的数据库, 共收录了 32,914 个带注释的人类外显子 circRNA, 是一个完整的人类环状 RNA 分子数据库, 每条记录包含详细的基因组信息、 RNA 编辑情况、 IRES 序列元件、 预测的 ORF 等信息,可以作为大规模研究人类 circRNA 的宝贵资源。
    可以根据基因名、细胞类型、pubmedID和蛋白编码能力浏览:
    这里展示的是有蛋白编码证据的circRNA:
  4. TSCD (tissue-specific circRNA database) ( http://gb.whu.edu.cn/TSCD)
    此数据库是一个系统分析组织特异性环状 RNA 数据库。包含人和小鼠 2 个物种, 16 种组织的特异性环状RNA。
    比如心脏特异性表达的circRNA:
    及预测结合的miRNA:
  5. MiOncoCirc (https://mioncocirc.github.io/)
    由密歇根大学开发的由癌症临床样本汇编的环状 rna 数据库。在这个数据库里面可以查询到某个 circRNA 在不同癌症临床样本的表达情况:
    7.CSCD(cancer-specific circRNA database) ( http://gb.whu.edu.cn/CSCD/)
    这个数据库是由武大何春江教授发布一个全新的肿瘤特异性 circRNA 数据库。
    根据肿瘤细胞查找circRNA:
  6. exoRBase(http://www.exoRBase.org
    这个外泌体环状 RNA 数据库是由复旦黄胜林教授开发的。exoRBase 数据库共收录了 58330 种 circRNAs, 15501 种 lncRNAs, 18333 种 mRNAs,它们来自 92 份血清外泌体 RNA-seq 测序样本。作者还依据GTEx project 获得组织特异性 RNA 表达特征,分析了相关 RNA分子的组织来源。
  7. circRNADisease http://cgga.org.cn:9091/circRNADisease/ 这个数据库是由武大何春江教授发布一个全新的肿瘤特异性 circRNA 数据库。
  8. exoRBase(http://www.exoRBase.org
    这个外泌体环状 RNA 数据库是由复旦黄胜林教授开发的。exoRBase 数据库共收录了 58330 种 circRNAs, 15501 种 lncRNAs, 18333 种 mRNAs,它们来自 92 份血清外泌体 RNA-seq 测序样本。作者还依据GTEx project 获得组织特异性 RNA 表达特征,分析了相关 RNA分子的组织来源。
  9. circRNADisease http://cgga.org.cn:9091/circRNADisease/
上一篇下一篇

猜你喜欢

热点阅读