试读注释和富集

【R语言】clusterProfiler富集分析,物种注释数据库

2021-11-18  本文已影响0人  生信交流平台

相信大家对Y叔的clusterprofiler这个R包并不陌生,一般做基因富集分析的时候都会用到这个R包。这个包非常实用,并且画出来的图也很不错。

其实小编前面已经花了不少篇幅给大家介绍过如何使用这个R包做GO富集分析和结果可视化,以及如何将富集结果中的gene ID转成基因名字

GO富集分析四种风格展示结果—柱形图,气泡图

GO和KEGG富集结果如何显示基因symbol

还有计算富集倍数的三种方法

GO和KEGG富集倍数(Fold Enrichment)如何计算

对于没有太多基础的小伙伴,小编还特地录制了视频进行了详细的讲解

GO简介及GO富集结果解读

四种GO富集柱形图、气泡图解读

当然使用clusterprofiler这个R包也可以进行KEGG富集分析

KEGG富集分析—柱形图,气泡图,通路图

当然小编也将以上所有内容整理成了一个系统的线上课程

GO和KEGG富集分析线上课程

我们知道一般做富集分析,都需要有一个注释数据库。里面存放了对每个基因的注释信息,告诉我们这个基因属于那一条KEGG通过,参与到那些生物学过程(BP),有那些生物学功能(MF)以及属于哪一种细胞成分(CC)。一般我们对人这个物种中的基因做富集分析的时候,都会用到org.Hs.eg.db这个注释数据库,Hs代表的是human。小编也讨论过如何安装这个注释数据库。加载R包org.Hs.eg.db出错,避坑指南!

library(org.Hs.eg.db)
library(clusterProfiler)
ego <- enrichGO(gene = DEG,
                OrgDb=org.Hs.eg.db,
                ont = "all",
                pAdjustMethod = "BH",
                minGSSize = 10,
                pvalueCutoff = 0.01,
                qvalueCutoff = 0.01,
                keyType='ENSEMBL')

那么问题来了,对于其他的物种,如小鼠,大鼠,线虫等等,其他物种的注释文件该如何获取呢?

可以从下面这个网页中查找,每一行代表一个物种的注释文件。

http://bioconductor.org/packages/release/BiocViews.html#___OrgDb

在做分析的时候我们只需要将代码中的org.Hs.eg.db更换成相应的物种的注释文件就可以了,例如我们换成小鼠的

library(org.Mm.eg.db)
library(clusterProfiler)
ego <- enrichGO(gene = DEG,
                OrgDb=org.Mm.eg.db,
                ont = "all",
                pAdjustMethod = "BH",
                minGSSize = 10,
                pvalueCutoff = 0.01,
                qvalueCutoff = 0.01,
                keyType='ENSEMBL')

参考资料:

GO富集分析四种风格展示结果—柱形图,气泡图

GO和KEGG富集结果如何显示基因symbol

GO和KEGG富集倍数(Fold Enrichment)如何计算

GO简介及GO富集结果解读

四种GO富集柱形图、气泡图解读

KEGG富集分析—柱形图,气泡图,通路图

GO和KEGG富集分析线上课程

加载R包org.Hs.eg.db出错,避坑指南!

【R语言】clusterProfilerf富集分析,物种注释数据库

上一篇 下一篇

猜你喜欢

热点阅读