MethBank:单细胞甲基化数据库
导语
生命与健康大数据中心(The BIG Data Center)由中国科学院北京基因组研究所于2016年成立。中国科学院北京基因组团队通过研究,建立海量生物组学大数据储存、整合与挖掘分析研究体系,发展组学大数据系统构建、挖掘与分析的新技术、新方法,建设组学大数据汇交、应用与共享平台。所建立的数据库目前具备5000个以上CPU计算核心及总容量超过8PB数据存储资源,已经开发形成了一系列的多组学数据库系统,初步形成了我国生命与健康数据交汇与共享的平台,具备可服务于全球的基因组数据共享网络。之前带大家认识了它们的其中一个数据库EWAS Data Hub:DNA甲基化芯片数据库,今天我们来看看他们的另一个数据库吧:MethBank 。
MethBank是一个全面的甲基化数据库,它集成了各种物种的共有参考甲基化组(CRM),全基因组单碱基分辨率甲基化组(SRM),DNA和RNA甲基化工具(MeTools)以及表观基因组范围关联研究(EWAS),并提供了甲基化数据可视化的交互式浏览器。 MethBank 3.0以高质量甲基化酶大规模整合为特色,涉及34个来自大量人类样品的共识参考甲基化组织,336个来自不同发育阶段/5个植物组织的单碱基分辨率甲基化组织,18个单碱基在人类和小鼠的多个阶段从配子和早期胚胎中分辨甲基化组织。
MethBank
http://bigd.big.ac.cn/methbank
以下,从5个方面介绍MethBank :
01 search
在首页,我们可以进行搜索:
搜索框下方还有搜索例子:GSE56879、4-cell embryo、MII oocyte、 Hematopoetic Progenitor Cell、Carcinoma。我们点击GSE56879,看看会返回什么:
结果分为两部分,上面的Samples是样本筛选,我们那可以选择Organism(目前只有人和小鼠的),Cell Type也很多,类型在首页上有可视化的图标展示。同时细胞的发育阶段、性别也可以选择。
上图是后部分返回的结果:一次展示不同样品对应的系列、生物、细胞类型、发育阶段、Strain。查看样品加入的序号链接,会看到GEO数据库对其的介绍,(样品状态、类型、生物、来源、生长协议、提取分子等),点击#More Details,展示信息如下:
02 Browse Project
这部分会展示13个甲基化单细胞的相关研究,大部分都是2016-2019年发布的,
表里会给出对应的PMID、文章标题、发表年份、杂志刊名、数据集、样本数,不同的单元组还会用不同的颜色标注,还提供了t-SNE_Analysis。我们来看看Integrative single-cell analysis of transcriptome, DNA methylome and chromatin accessibility in mouse oocytes这篇文章对应的t-SNE_Analysis:
首先是对 Datasets: GSE114822的基本介绍:
Part 2 ,是t-SNE可视化。
其中的着色,我们可以选择组织来源、发展阶段、基因型、治疗方式、年龄、性别、疾病等。点击颜色点,会展示相关的细胞信息。
03 Browse Sample
在这里我们也可以根据样本的组织类型、细胞类型、发育阶段、性别进行筛选。
04 Toolkit
Toolkit部分目前只有Lollipop Plotter,用来进行单细胞甲基化的Lollipop绘图。使用起来也非常简单,三步即可。
①输入文件:
甲基化文件必须是一个制表符分隔的文件,具有以下结构:
1.甲基化水平必须以百分比表示(从0到1)。
2.第一行必须指出CpG的位置(位置可以不排序)。
3.每行包含一个样品的甲基化水平。
4.第一列表示样品标识符。每个中间列包含CpG的甲基化水平。
5.请注意,要绘制的CpG和样品的最大数量均为100。
②设置甲基化阈值:
可以自定义阈值或使用我们的默认参数。
默认参数表示大于90%DNA甲基化的
CpG位点被认为是甲基化的,而小于10%的CpGs位点被认为是未甲基化的
有【甲基化(<):0.1 】和【取消甲基化(>):0.9】两种选择。
③绘图设置:
这部分可以自定义绘图参数或使用网站的默认参数。
点类型参数根据站点的位置信息确定点是连续排列还是不连续排列,点大小决定绘制点的大小。
05 Download
高级用户通过Sample Accession下载Bed文件,链接是:ftp://download.big.ac.cn/scmethmap/singlebed/{SampleAccession}.bed.gz 其他的细胞类型是可以批量下载的。
MethBank能够系统地鉴定与年龄密切相关的甲基化位点、在不同年龄段具有恒定甲基化水平的位点、差异甲基化启动子、年龄特异性差异甲基化胞嘧啶/区域和甲基化CpG岛。而且,MethBank提供了在线估计人甲基化年龄的工具,并分别鉴定差异甲基化的启动子,功能十分强大。综合起来,MethBank对于解读表观遗传学研究的DNA甲基化调控机制有很大的帮助,大家不要错过ya 。
References:
Li R, Liang F, Li M, et al. MethBank 3.0: a database of DNA methylomes across a variety of species. Nucleic Acids Res. 2018;46(D1):D288-D295. doi:10.1093/nar/gkx1139