GEO数据挖掘

优化差异基因分析的三板斧

2020-05-05  本文已影响0人  柳叶刀与小鼠标

写作背景:

由于我经常下载和分析geo数据集,而由于geo数据集上的数据分布不一,标准不统一。经常会遇到的难题是,差异分析结果并不满意,包括:1差异基因太少,一个数据集坐下来,只找到几百个差异基因2热图不满意。所以我经过自己的经验和总结,找到了三种方法来优化差异分析。

示例:


我们可以发现N组样本和T组样本在PCA结果上分开了。这样做差异分析结果必然是比较令人满意的。比如说,转换以前我们只能在两组中找到300多个差异分析,而经过转换,差异分析数目达到了5000多个,差异基因数目增加了十倍不止,这就给我们后续分析提供很大的空间。此外,之前的差异分析结果比如说火山图和热图是非常难看的,尤其热图根本看不出来趋势,转换以后就非常打动且能说明问题和实验目的。

代码:

上一篇下一篇

猜你喜欢

热点阅读