dbCoRC:核心转录因子数据库
欢迎关注”生信修炼手册”!
在人和小鼠中,已经识别到的转录因子有几百种之多。众所众知,转录因子的调控作用是具有细胞或者组织特异性的,在某种特定的组织或细胞中,发挥调控功能的只是一小部分转录因子。
科学家通过研究发现,即使是在特定的细胞或组织中,发挥作用的转录因子在调控网络中的地位也是不同的。其中有一部分转录因子被称之为核心转录因子,这部分转录因子不仅仅可以调节自身的靶基因,而且可以相互调节,从而构成一条交叉调节的回路,最典型的就是胚胎干细胞中,NANOG,SOX2,POU5F1/OCT4 这几种转录因子构成的调控回路。
将某种细胞或者组织中的核心转录因子及其调控回路称之为core transcription regulatory circuitry, 简称CRC
。超级增强子SE
区域内包含许多转录因子结合位点,有科学家发明了CRC Mapper这种算法,通过超级增强子关联的转录因子来识别细胞或组织中的CRC。
dbCoRC是一个核心启动因子数据库,通过超级增强子关联的转录因子来鉴定不同组织或者细胞中的CRC。以H3K27ac作为增强子的mark, 从GEO数据库中下载chip_seq原始数据,首先通过MACS
软件识别增强子区,然后通过ROSE
软件识别超级增强子。
识别到超级增强子之后,首先利用TRANSFAC/MEME数据库下载转录因子motif信息,通过FIMO
软件进行motif scan分析,在超级增强子区域内寻找转录因子结结合位点。利用这种策略寻找超级增强子想关联的转录因子,在此基础上识别CRC, 完整的pipieline如下图所示
对应的文章发表在Nucleic Acids Research上,链接如下
https://academic.oup.com/nar/article/46/D1/D71/4103600
数据库的网址如下
http://dbcorc.cam-su.org/
通过Browser
菜单,可以浏览每个样本中的CRC信息,示意如下
点击样本名称,可以查看详细信息,首先是给样本中的核心转录因子构成的调控网络,示意如下
其次是核心转录因子对应的超级增强子区域,示意如下
点击转录因子的ID, 可以查看该转因子在其他转录因子SE区域的结合位点,示意如下
同时还提供了该转录因子在TCGA
等不同数据库中的表达量信息,示意如下
dbCoRC侧重于分析超级增强子区域关联的转录因子间的调控关系,如果只是单纯的分析超级增强子,更加推荐SEdb数据库。
·end·
—如果喜欢,快分享给你的朋友们吧—
扫描关注微信号,更多精彩内容等着你!