GREAT网页版学习笔记(预测顺式调控元件)
参考文章:
1.使用GREAT对peak进行功能注释
2.用网页版工具GREAT来对CHIP-seq的peaks进行下游功能分析
前几天老板心血来潮,在视频里教给我一个软件的使用,这款软件叫做GREAT。软件的网页版网址:http://great.stanford.edu/public/html/
GREAT是一款用来预测顺式调控区域的软件。
目前最新版的GREAT(4.0.4)只支持human和mouse基因组。如果你想分析其他物种,比如斑马鱼,你需要选择3.0.0版来分析。
怎么选择不同版本的GREAT呢?首页左上角就可以:
1.这个软件是做什么用的?
许多编码基因都有它们各自的生物学功能注释。然而非编码区域通常缺失注释。GREAT通过分析附近基因的注释,从而给一组非编码基因区域分配生物学意义。因此,这个方法就有利于我们分析非编码区域的顺式功能。顺式调控区域可以通过实验(比如CHIP-seq)和计算的方法来鉴定。
2.你需要上传什么文件?
一般来说,在你得到CHIP-seq或者ATAC-seq结果后,你可以得到不同分组的差异peaks。那么拿到这些peaks以后,你需要把它们存成bed文件,像下面这样:
一共三列,第一列是染色体号,第二列是peak的起始位置,第三列是peak的结束位置3.如何分析?
打开GREAT网页版:
提交后,会弹出新的页面:
另外,点开页面上方的Job Description那块的“+”号:
会弹出新的页面,你会得到两种表格:
选择你想要下载的表,老板说一般下载右边这个,点击“Download table as text”就可以了。表格里每一行的括号里面的数字就是这个peak距离相关基因TSS的距离。
看起来还是挺容易的。有的同学会问,这个软件的目的是干嘛呢?拿到的这些基因列表又有什么意义呢?在老板视频教我怎么使用这个软件之后,我也问了同样的问题。他说:你的RNA-seq的数据告诉你哪些基因mRNA水平上调了,哪些下调了,但是你不知道这些上调或者下调的基因,它们在染色体上的调控元件是不是真正的打开或者关闭了。有可能一个基因下调了,但是它的调控区域打开了,只是binding了一个抑制它转录的一个TF而已。而有的基因下调了,是因为它的调控区域关闭了,使得促进它转录的TF无法接近它,导致了它的下调。当然这个软件只能预测,真正是否某一个peak关联一个基因,还需要实验去证明。