复现一篇WGCNA文章(含代码)(五)

2023-10-10  本文已影响0人  生信开荒牛

前面我们已经拿到了差异表达基因以及WGCNA与肿瘤最相关的两个模块里的基因,下面我们就从这些基因中找到文章标题中的那3个关键基因:AURKA, TOP2A and MELK;

文章:AURKA, TOP2A and MELK are the key genes identified by WGCNA for the pathogenesis of lung adenocarcinoma

1.png

首先看一下文章是怎么找的:

2.png 3.png

一、基因取交集

这里其实就是一个韦恩图,这里推荐一个在线工具:https://bioinfogp.cnb.csic.es/tools/venny/index.html

4.png

这里只展示yellow模块基因,turquoise模块用同样的方法取交集;

二、PPI分析

STRING网站做PPI分析,这里也只展示yellow模块基因与DEG的交集基因;

cytoscape找key gene;

没有做过这类分析的朋友可以参考下我前面的笔记:使用STRING数据库进行PPI分析

5.png

我们用差异表达基因和yellow模块里的相交基因,使用cytoscape软件里的cytohubba插件,排名靠前的12个基因包含文章标题中的三个基因;

三、GEPIA网站验证关键基因

在GEPIA网站中做表达及生存分析:http://gepia.cancer-pku.cn/

1 表达分析

6.png

这里只展示TOP2A的表达情况,排名前12个基因按同样的方法,在正常组织和肿瘤组织中均是显著差异表达的;

7.png

2 生存分析

8.png

TOP2A基因对LUAD预后有显著影响;

9.png

最后,文章通过RT-qPCR和WB实验最后确定AURKA, TOP2A和MELK这三个基因的基因表达水平和蛋白表达水平均显著差异表达;

10.png

小结:

本篇文章通过差异分析,WGCNA分析,功能富集分析,PPI分析以及简单的实验表达分析,找出LUAD的三个Key gene,感兴趣的朋友可以换个肿瘤,换个数据集,按前面的步骤挖掘自己需要的数据吧。

往期文章复现:

复现一篇WGCNA文章(含代码)(一)

复现一篇WGCNA文章(含代码)(二)

复现一篇WGCNA文章(含代码)(三)

复现一篇WGCNA文章(含代码)(四)

上一篇 下一篇

猜你喜欢

热点阅读