复现一篇WGCNA文章(含代码)(五)
前面我们已经拿到了差异表达基因以及WGCNA与肿瘤最相关的两个模块里的基因,下面我们就从这些基因中找到文章标题中的那3个关键基因:AURKA, TOP2A and MELK;

首先看一下文章是怎么找的:

- 分别用两个模块里的基因与差异表达基因取交集;
- STRING网站做PPI;
- Cytoscape里的cytohubba排名靠前的基因;
- GEPIA网站使用TCGA和GTEx数据做表达,生存分析等;

一、基因取交集
这里其实就是一个韦恩图,这里推荐一个在线工具:https://bioinfogp.cnb.csic.es/tools/venny/index.html

-
将我们的差异基因以及yellow模块的HUB基因分别粘贴到1和2处;
-
点击右边图形中的相交处(3位置),在4位置就会显示相交的163个基因;
这里只展示yellow模块基因,turquoise模块用同样的方法取交集;
二、PPI分析
STRING网站做PPI分析,这里也只展示yellow模块基因与DEG的交集基因;
cytoscape找key gene;
没有做过这类分析的朋友可以参考下我前面的笔记:使用STRING数据库进行PPI分析;

我们用差异表达基因和yellow模块里的相交基因,使用cytoscape软件里的cytohubba插件,排名靠前的12个基因包含文章标题中的三个基因;
三、GEPIA网站验证关键基因
在GEPIA网站中做表达及生存分析:http://gepia.cancer-pku.cn/
1 表达分析

这里只展示TOP2A的表达情况,排名前12个基因按同样的方法,在正常组织和肿瘤组织中均是显著差异表达的;

2 生存分析

TOP2A基因对LUAD预后有显著影响;

最后,文章通过RT-qPCR和WB实验最后确定AURKA, TOP2A和MELK这三个基因的基因表达水平和蛋白表达水平均显著差异表达;

小结:
本篇文章通过差异分析,WGCNA分析,功能富集分析,PPI分析以及简单的实验表达分析,找出LUAD的三个Key gene,感兴趣的朋友可以换个肿瘤,换个数据集,按前面的步骤挖掘自己需要的数据吧。
往期文章复现: