Hi-C数据分析

3dsnp:SNP在染色质环介导的调控网络中的分布数据库

2019-08-19  本文已影响4人  生信修炼手册

欢迎关注”生信修炼手册”!

在全基因组范围内的SNP位点中,位于编码基因上的SNP位点只是非常小的一部分,绝大部分都是位于非编码区。通过ENCODE, Roadmap等项目,得到了SNP位点与基因组各种元件的位置关系,然而仅仅通过位置分布来解释和预测SNP在基因调控作用中的作用是非常困难的,类似增强子的调控作用,基因调控是一个非常复杂的过程,不仅仅局限在基因组位置相近的元件之间。

随着三维基因组学的发展,尤其是染色质环结构的发现,使得人们对于基因调控的机制有了进一步认识。通过染色质环在空间上拉近了增强子与启动子的距离,使得增强子可以与启动子结合,从而突破线性距离的限制,发挥调控作用。

为了更好的研究SNP与基因调控的关系,科学家将染色质环介导的互作信息和SNP联系起来,通过公共数据库,挖掘并整理出了位于非编码区的SNP位点在空间互作中的分布。相关结果整理成了一个数据库3dsnp,对应的文章发表在Nucleic Acids Research上,链接如下

https://academic.oup.com/nar/article/45/D1/D643/2333918

数据库的网址如下

http://cbportal.org/3dsnp/

从dbSNP数据库中得到human的SNP位点信息,然后通过1000G数据库中的频率进行LD分析,得到SNP位点间的连锁关系。同时对于SNP位点附近的基因进行注释,利用UCSC提供的基因注释,注释SNP位点上下游两侧2kb范围内的基因。

对于染色质空间互作信息,直接从已经发表的hi-c数据中得到染色质环的信息。如果原始hi-c数据集没有提供染色质环信息,则用HOMER软件进行分析得到染色质环。

结合染色质环和SNP位点的基因组位置,就可以构建出SNP位点在染色环介导的调控网络中的分布。为了更进一步研究SNP在调控网络中的影响,还提供了SNP对应的增强子,启动子,转录因子结合位点,motif等注释信息。

同时为了更好的筛选SNP位点,结合以上提到的多种注释信息,建立了一套打分系统,对SNP位点在调控网络中的重要性进行打分。

通过首页的检索框可以方便的进行检索,检索结果示意如下

点击SNP ID可以查看详细信息,以rs746077852为例,结果如下

1. 汇总信息

这部分展示该SNP位点的各项得分值,示意如下

2.  SNP位点的基因组位置和频率

3.  在基因组上分布的可视化

提供了circos和UCSC两种可视化结果,示意如下

4.  Linear closest gene

SNP位点上下游2kb范围内的基因,示意如下

5. 在染色质环中的分布

6.  在增强子和启动子中的分布

7. 物种间保守性

3dSNP数据库将SNP位点与染色质环介导的调控信息联系起来,提供了SNP研究的新视角,为研究SNP对基因调控的影响提供了新思路,非常值得参考和借鉴。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

上一篇 下一篇

猜你喜欢

热点阅读