科研信息学

RAEdb:基于STARR-seq和MPRA数据的enhance

2020-04-05  本文已影响0人  橙子牛奶糖

欢迎来到"bio生物信息"的世界

1 前言

尽管之前已经有很多的数据库收集了enhancers,比如EnhancerAtlasVISTA Enhancer BrowserFANTOM5DENdbdbSUPERSEA,但这些数据大部分是通过方法、模型推断的,因此其是否有真实的enhancers或promoters活性则需要打个折。

下面简要介绍一个公共数据库RAEdb(http://www.computationalbiology.cn/RAEdb/index.php#),这个数据库的优点是实打实的汇集了大规模的实验数据。

RAEdb主要收集的数据有STARR-seqMPRA数据。

截至目前为止,该网站包含500,000 个enhancers 、7500 个 Epromoters 、55 个样本、8 项研究。

STARR-seq:该方法是用来评估启动子区域的增强子活性。

Epromoters: 指的是既可以作为promoters 同时可以作为远端基因的enhancers

2 鉴定enhancers和epromoters的流程

enhancers和epromoters的鉴定流程如下图:

主要是从GEO数据库搜集目前已发表的STARR-seqMPRA数据,然后分别进行Enhancer peak calling ,鉴定具有enhancers和Epromoters活性的序列。

图片2.png

3 RAEdb数据库的功能种类

下图是RAEdb数据库所包含的功能种类。


微信图片_20200405154308.png

第一个功能是可以浏览、查阅。查阅的方式多样,可以是按照研究队列的方式,也可以是按照序列、基因、位置等方式。

微信图片_20200405153907.png

我测试了一下,这个网站的查询方式不是很灵活,他们是按照匹配度查询的。

比如1号染色体的9975360-9975398序列有enhancer活性,如果输入9975363,则显示查询不出来。当输入9975时,则有结果。

第二个功能是可以在基因组上可视化enhancers、histone modification。

第三个功能是可以下载,该网站提供了FASTA和BED两种格式,按照研究队列下载。


今天的推荐就讲到这里,如果你研究的SNP刚好在基因间隔区,又刚好找不到它有什么功能报道,那就试试这个网站,说不定有惊喜哦。

上一篇下一篇

猜你喜欢

热点阅读