chip_seq数据分析科研信息学生信在线工具

GTRD:最全面的人和小鼠转录因子chip_seq数据库

2019-07-25  本文已影响12人  生信修炼手册

欢迎关注”生信修炼手册”!

GTRD从SRA, GEO, ENCODE等公共数据库中收集转录因子相关的chip_seq数据,采用标准流程进行peak calling分析,并基于已有的转录因子motif数据,预测了转录因子结合位点TFBS, 数据库网址如下

http://gtrd.biouml.org/

整个数据库构建的pipeline示意如下

采用bowtie2将reads与基因组进行比对,并利用MACS,SISSRS等4款软件进行peak calling, 得到转录因子的peak区域。

对于同一个转录因子,同一种peak caling软件得到的peak区域,如果两个peak区间的中心距离小于50bp的话,就合并为一个区间,此采用这种方式来对原始的peak进行聚类,即cluster。

对于同一个转录因子,多种peak calling软件得到的所有peak区域,将peak中心小于50bp的peak区间归类为一组,并从中根据软件的优先级选取一个peak作为代表,各个软件优先级从高到低为GEM, PICS, MACS, SISSRs,这种聚类方式称之为MetaClusters, 构建出一个转录因子所有的非冗余peak区间。

该数据库常用的使用场景如下

1. 查询转录因子chip_seq原始数据

2. 查找基因上的转录因子结合位点

3. 查询转录因子的靶基因

除了在线查询外,该数据库还开放下载功能, 链接如下

http://gtrd.biouml.org/downloads/19.04/chip-seq/

GTRD收录的转录因子的数据最多最全面,其查询转录因子靶基因的功能真的是非常实用。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

上一篇下一篇

猜你喜欢

热点阅读