TCGA数据分析生信精读文献生信分析流程

文献推荐-基因共表达网络分析口腔鳞癌中的关键模块和hub基因

2019-03-06  本文已影响14人  PriscillaBai

Application of weighted gene co-expression network analysis to identify key modules and hub genes in oral squamous cell carcinoma tumorigenesis

引言

这篇文章是发在18年oncotarget上的,可以说是正儿八经的注水文章,但由于我最近在做WGCNA,想借鉴更多的人是怎样做这一部分的,所以拿出来认真的阅读,让我们也学习一下水文章的套路。

思路

结果与结论

  1. 将20027个基因做方差分析,取前5000个基因做WGCNA,得到如下聚类。


  2. WGCNA选取阈值


  1. 相关性分析




    开始各种相关性分析,模块之间的相关性,模块和表型的相关性。最后发现turquoise和brown模块和表型的相关性最高。

4 寻找hub gene
module membership vs 基因显著性 的相关性


挑出Top前30的基因进行可视化


5 生存分析

挑出前30基因进行生存分析,将TOP5的生存分析结果展现出来


6 富集分析

image.png

7 用另一套数据集做验证


做了差异分析,将差异基因和模块中的基因做交集。(这能说明啥呢,hmmm...实验设计的有点无语,这也叫验证嘛?)

8 数据库的转录组验证



文中没给出用的哪种统计学方法,也没有纵坐标,所以大家将就看吧。

9 数据库中找出这些基因的IHC免疫组化,从分子水平上验证

褐色是表达, 蓝色是细胞核不表达。这个数据库是The human protein atlas database

10 TCGA HNSC数据库看基因改变程度


B图:10个hub gene在百分之多少的病人中改变了
A图:10个基因各种改变的频率
C图:网络,10个基因和其他50个显著改变基因之间的关系。并展示了基因和药物的关系

个人觉得,后面几个数据库的应用还是以前没见过的,可以拿来借鉴下。

上一篇 下一篇

猜你喜欢

热点阅读