TCGA数据分析R语言与科研生信科研

使用TCGAbiolinks进行甲基化和转录组数据的联合分析

2019-08-23  本文已影响4人  生信修炼手册

欢迎关注”生信修炼手册”!

DNA甲基化作为表观遗传的一种重要标记,在基因表达调控中发挥重要作用,已有研究表明,位于启动子区的甲基化会抑制基因表达。结合甲基化数据和基因表达谱数据,可以更好的分析甲基化的调控功能。

通过TCGAbiolinks不仅仅可以对某种类型的数据进行分析,还可以进行多组学数据的联合分析,DNA甲基化和基因表达谱数据的联合分析过程如下

1. 甲基化芯片数据

以肾上腺皮质癌为例,首先从TCGA数据库下载450K甲基化芯片的数据,分析后得到差异甲基化位点

差异甲基化位点的火山图结果如下

2. 基因表达谱数据

首先下载数据

然后进行差异分析,代码如下

差异基因火山图的绘制代码如下

效果图如下所示

3. 联合分析

starburst plot是联合分析最常用的可视化方法,代码如下

生成的效果图如下

这里采用了差异分析的FDR值来绘制图片,其他文章中也有采用fold change来绘制该图的,因为根据fold change的大小更好判断差异表达的趋势,根据FDR值只能判断是否显著差异。

在DNA甲基化和基因表达谱的联合分析中,鉴于DNA甲基化抑制基因表达的思想,通常关注二者间为负相关的位点,即甲基化下调而基因上调,甲基化下调基因上调的相关位点。在上图中,显著差异且存在负相关的位点用圆圈进行了标注。

通过TCGAbiolinks可以轻松实现DNA甲基化和基因表达谱数据的联合分析,美中不足的是它的starburst plot没有采用常用的fold change来绘制。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

上一篇下一篇

猜你喜欢

热点阅读