生物信息

为什么很多时候GO富集分析不推荐使用GOslim

2020-05-13  本文已影响0人  生信石头

写在前面

Emmm... 似乎发现自己的记忆力大不如前。类似的问题以前我在知识星球写过,不过现在确实没有太多去上面写。
TBtools最早期的两大主要功能,1)序列提取;2)GO分析,包括注释和富集分析。当我们对一个基因集合进行 GO 分析的时候,往往可能会遇到一个问题。即,GO 注释结果过于分散和复杂。于是存在 GO slim。

GO slim

一般情况下,我们在做GO分析的时候会使用



但是这个文件中,其实包含的信息比较庞大,如:

  1. 人类神经发育相关的注释,但是...如果你做植物,那么肯定植物又没神经?
  2. 植物花粉发育相关的,但是....如果你做动物,那么动物哪里有花粉?
    。。。

于是GO slim就有了存在的理由。这事实上就是一堆又一堆的人对已有GO数据库进行相对特异性的注释标注,如存在



打开其中的注释信息可以看到



授粉,果然就是植物的。
但是问题来了,

只有 98个 Term!是的,如果用这个文件去做分析,那么你当然可以得到只属于植物的GO注释结果。然而事实是,如果生物体再简单,也简单不到98个Term就可以覆盖。

回头再看 go-basic.obo



有 40000+ 个... 如果看看里面的 GOslim 信息。



确实只有98个....

OK,那么缺少的是啥?

GO slim 缺少了很多生物体通用的Term

我的课题比较诡异,会涉及到减数分裂....如果我们用减数分类来搜索,会发现



找不到.... 而在 go-basic.obo中


写在最后

于是....我一般还是建议....用全面的,分析出来之后,自己爱怎么过滤就按照自己的心情来。

上一篇下一篇

猜你喜欢

热点阅读