chipBase:转录调控数据库
欢迎关注”生信修炼手册”!
转录调控是生命活动中重要的调控机制,通过chip_seq数据,我们可以得到转录因子或者组蛋白修饰和基因之间的调控关系。chipBase数据库收集了来自10个物种共一万多个样本的chip_seq数据,整理出了转录因子和各种基因,包括蛋白编码基因,lncRNA,miRNA, tRNA等ncRNA之间的调控网络,该数据库网址如下
http://rna.sysu.edu.cn/chipbase/index.php
该数据不仅提供了转录因子和各种基因的调控网络,还提供了转录因子结合位点和motif的信息,同时利用TCGA数据库中的RNA_seq数据,分析了转录因子和基因之间的共表达关系,整个数据库的构建流程示意如下
chip_seq数据包含了两种类型,一种是转录因子,另外一种是组蛋白修饰,从chip_seq的数据中,可以分析得到结合位点的区域,称之为peak。
通过转录因子结合位点,可以进一步分析结合区域的motif, 还可以通过peak区域的基因注释,得到转录因子和各种基因之间的调控关系。
该数据库将基因分成了以下几类
-
LncRNA
-
miRNA
-
OtherNcRNA
-
Protein
每个类别对应一个子菜单,以LncRNA
为例,可以检索得到某个转录因子与lncRNA之间的调控关系,检索框示意如下
通过chip_seq数据分析转录因子与基因的调控关系,实际上是通过对peak区间进行基因注释得到的,由于结合位点位于基因的附近,所以通常会指定一个区域,比如上下游各延伸1kb, 如果两个区间重叠,就认为二者之间存在一个调控关系。
检索结果示意如下,给出了转录因子CTCF
所有可能调控的lncRNA
通过Regulator
菜单,可以检索调控某个基因的所有转录因子,以TP53
为例,检索结果示意如下
通过Motif
菜单,可以查看转录因子motif分析的结果,结果示意如下
除此之外,官网还提供了以下两个工具
1. ChIP-Function
对转录因子所有调控的靶基因,进行GO富集分析,结果示意如下
2. Co_Expression
利用从TCGA等公共数据库中整理的约2000个RNA_seq的表达谱数据,分析指定基因的共表达关系, 结果示意如下
通过计算pearson相关系数和线性回归来分析两个基因表达量之间的相关性,并给出如下所示的结果
通过chipBase数据库,可以方便的查看转录因子和各种基因之间的调控关系。
·end·
—如果喜欢,快分享给你的朋友们吧—
扫描关注微信号,更多精彩内容等着你!