EnhancerAtlas:增强子地图
EnhancerAtlas是一个整合的增强子数据库,从数据库命名就可以看出作者的『野心』很大。
因为带有Atlas的数据库好像都很重要,例如The Cancer Genome Atlas(TCGA)、Expression Atlas等。
当然上面的是玩笑话,回到正题,我开始介绍这个数据库。
惯例先给出文章
EnhancerAtlas: a resource for enhancer annotation and analysis in 105 human cell/tissue types
数据库网址:http://www.enhanceratlas.org/index.php
一、增强子Enhancer
首先,我们来简单了解一下什么是增强子。
增强子是能与转录因子结合,使相关基因转录增强的DNA序列。转录调控是基因控制的最常见形式,转录因子的活性使得基因在个体不同发育阶段、不同类型细胞中被特异的调控。
增强子序列位于基因的上游或下游,转录因子与之结合,从而刺激或增强相关基因的转录。增强子作用于同一条DNA分子的基因,但它能够离受调控基因转录起始位点数千个碱基对的距离。因为DNA在空间上是螺旋折叠的,所以当DNA在折叠状态下时,增强子能够离受调控基因的转录起始位点很近。另外增强子没有方向性。
以上翻译自https://www.nature.com/scitable/definition/enhancer-163
目前,识别增强子的方法如下:
(1)Chip-seq/Chip-chip识别转录因子结合位点,
(2)增强子特异的因子也可用于识别增强子,如EP300,EP300的结合位点常用于预测增强子;
(3)RNA聚合酶Ⅱ能与数千个增强子结合,所以RNA聚合酶Ⅱ的最大亚基POLR2A也可用于寻找增强子位点;
(4)脱氧核糖核酸酶Ⅰ超敏位点(DHS)代表开放染色质区域,许多覆盖有增强子;
(5)甲醛辅助分离调控元件(FAIRE)结合测序,能识别大量激活调控元件,包括增强子;
(6)一些组蛋白修饰模式反应了不同的染色质状态,如H3K4me1和H3K27ac的结合广泛用于增强子的标记;
(7)增强子序列能够转录,转录的增强子RNA(eRNA)也是激活增强子的标志;
(8)染色体3D构象的方法(e.g. 5C and ChIA-PET, Capture-C)也能提供增强子-启动子相互作用的信息。

上述这么多方法能够获得增强子位点,但增强子位点信息分散与多个数据库,亟待整合。
而且,不同技术得到的增强子位点有较大差异,所以在不同技术中都能找到的增强子位点才更加可靠。
以上一切,催生了EnhancerAtlas这个数据库。
二、数据库简介
数据库提供的增强子注释是基于hg19。
基于至少3种独立的高通量实验数据集(例如histone modification, eRNA, transcription factor binding and DHS)预测增强子;
下图中的Track的数目代表样本有几种实验方法验证;

目前数据库包含76个细胞系、29个组织中2534123个增强子。
利用数据库,研究人员可以
(1)检查在给定基因组区域内预测增强子的实验证据;
(2)比较不同细胞系、组织的增强子;
(3)识别某个基因相关的增强子;
(4)预测由一套顺式作用元件调控的基因。
三、数据库使用
数据库主页,如下图所示

1. Search enhancers by region

结果如下:

2. Search enhancers by gene

结果如下:

3. Compare enhancers across cells

结果如下:

4. Compare enhancers of gene across cells


5. Generate enhancer-gene network


6. Predict target genes for genomic regions (e.g. peaks from ChIP-Seq)


7. DOWNLOAD
点击主页上的『DOWNLOAD』后,选择下载增强子序列或者增强子-基因的相互关系

这里需要注意的是,增强子-基因的相互关系的数据格式

8. LINKS
外部数据库以及用到的软件

朋友们,打开你的电脑,搜索『EnhancerAtlas』,花个10分钟,熟悉一下这个数据库,绝对物超所值~~~
欢迎大家关注我的微信公众号『生信family』
