MethHC: 整合了癌症相关的甲基化与基因表达谱数据的数据库
2018-05-09 本文已影响146人
生信修炼手册
在MethHC
数据库中,提供了18种癌症相关的DNA甲基化,microRNA表达谱和基因表达谱的数据,这里的数据来源于TCGA
数据库。同时采用线性回归的方法计算甲基化和表达谱数据之间的关联。
整个数据库包含的数据汇总如下:
相比其他的甲基化数据库,Meth
有以下两个特点:
-
数据来源于TCGA,同时包含了甲基化和基因表达谱以及microRNA表达谱的数据;
-
将基因划分为8个区域,甲基化位点划分为5个区域,针对单个区域计算甲基化和表达谱数据之间的相关性
基因和甲基化区域的划分方式如下所示:
和其他数据库比较的结果
在Browse Top 250
中,以单个基因为单位,查看该基因在癌症中的甲基化情况和表达量的情况
对于甲基化数据,其表达量采用beta
值来衡量;对于基因表达谱数据,定量方式为RPKM
;对于microRNA的表达谱,采用RPM
定量方式;通过泊松相关系数计算甲基化数据和表达谱数据之间的相关性。
以SPDYE1
为例,给出所有基因区域和甲基化区域的结果
对于每个区域,会给出以下三个结果
甲基化数据和表达谱数据表达量的相关性分析
甲基化数据和表达谱数据差异倍数的相关性分析
TCGA数据库中记录的基因的甲基化和RNA_seq 数据详细情况
MethHC
还提供了基因检索Gene Search
的功能,可以按照两种方式进行筛选
基因列表
KEGG通路
通过MethHC
数据库,我们可以查看基因已有的甲基化和表达谱研究结果,也可以根据癌症类型,查看研究的较多的热点基因。