NAR2019数据库——ChEA3转录因子富集分析
image.pngChEA3是一个预测转录因子富集分析的数据库。这个数据库整合了ENCODE;ReMap以及一些独立发表的 CHIP-seq数据,同时还整合和GTEx ; TCGA 以及ARCHS4内的RNA-seq数据内的转录因子共表达数据。另外还整合了Enrichr数据库内基因之间的转录因子共发生分析。
数据输入
CHEA3
数据库数据输入很简单。这个数据库只需要输入基因名即可。需要注意的是,这个数据库只能数据 基因名; 对于其他比如 ENSID;ENTREZID等都是不支持的。同时呢,这个数据由于对于基因名的大小写字母也没有区分。但是这个数据库底层数据还是人的数据。如果使用其他物种的可能也能得到结果,但是不一定准确。
另外数据库还支持文件上传的方式。
img在输入完基因名之后,我们点击提交即可。
结果解读
结果部分分成五个部分分别是: TABLES
; Global Network
; Local Network
; Bar chart
; clustergram
。
表格展示
是以表格的形式展示结果。结果当中包括: 转录因子的基因名;调控的基因;来自的数据库
image.png这个数据库由于是综合了多个数据库得到的结果,所以数据库对于RANK的排名有多种选择。默认的是Mean Rank
方式即综合多个数据库得到的平均排名。作者也做过验证发现平均排名结果更准确一些。
我们可以在数据库选择上面,选择我们想要的不同数据库结果
img整体相互作用网络图
Global Network
是以网格的形式展示所有输入基因的相互作用。这个数据结果是基于RNA-seq数据的WGCNA共表达分析得到的。我们可以通过网络图选择不同数据的结果。
默认的网络图处理转录因子。别的都是灰色的。我们可以通过Network Options
来调整结果的可视化。例如基于WGCNA module
来进行着色
转录因子之间相互作用图
Local Network
是以网格的形式展示转录因子-转录因子之间的相互调控的结果。这个结果是基于CHIP-seq的数据得到的。
核心转录因子相关数据可视化
Bar Chart
展示了核心转录因子在各个数据库所占的比重。如果换成单个数据的话,则会展示起分析结果的P值
基因聚类分析
Clustergram
通过热图的方式来展示输入的基因在不同数据集之间的结果,同时可以对起分布进行聚类。
API
另外网站也提供了关于代码分析数据的方式。例如如果使用R的话。
rm(list = ls())
library(httr)
library(jsonlite)
genes = c("SMAD9","FOXO1","MYC","STAT1",'STAT3',"SMAD3")
url = "https://amp.pharm.mssm.edu/chea3/api/enrich/"
encode = "json"
payload = list(query_name = "myQuery", gene_set = genes)
#POST to ChEA3 server
response = POST(url = url, body = payload, encode = encode)
json = content(response, "text")
#results as list of R dataframes
results = fromJSON(json)
数据下载
同时网站也贴心的提供了下载网站所有分析结果的原始数据。可以方便我们DIY
image.png