GTRD:最全面的人和小鼠转录因子chip_seq数据库
2019-07-25 本文已影响12人
生信修炼手册
欢迎关注”生信修炼手册”!
GTRD从SRA, GEO, ENCODE等公共数据库中收集转录因子相关的chip_seq数据,采用标准流程进行peak calling分析,并基于已有的转录因子motif数据,预测了转录因子结合位点TFBS, 数据库网址如下
http://gtrd.biouml.org/
整个数据库构建的pipeline示意如下
采用bowtie2将reads与基因组进行比对,并利用MACS,SISSRS等4款软件进行peak calling, 得到转录因子的peak区域。
对于同一个转录因子,同一种peak caling软件得到的peak区域,如果两个peak区间的中心距离小于50bp的话,就合并为一个区间,此采用这种方式来对原始的peak进行聚类,即cluster。
对于同一个转录因子,多种peak calling软件得到的所有peak区域,将peak中心小于50bp的peak区间归类为一组,并从中根据软件的优先级选取一个peak作为代表,各个软件优先级从高到低为GEM, PICS, MACS, SISSRs,这种聚类方式称之为MetaClusters, 构建出一个转录因子所有的非冗余peak区间。
该数据库常用的使用场景如下
1. 查询转录因子chip_seq原始数据
2. 查找基因上的转录因子结合位点
3. 查询转录因子的靶基因
除了在线查询外,该数据库还开放下载功能, 链接如下
http://gtrd.biouml.org/downloads/19.04/chip-seq/
GTRD收录的转录因子的数据最多最全面,其查询转录因子靶基因的功能真的是非常实用。
·end·
—如果喜欢,快分享给你的朋友们吧—
扫描关注微信号,更多精彩内容等着你!