GEO数据挖掘（三）使用DAVID数据库进行GO、KEGG富集分

2022-07-03 本文已影响0人生信开荒牛

首先整理好前面已经处理好的差异基因数据，部分基因截图如下：

1.png
打开DAVID网站： https://david.ncifcrf.gov/home.jsp

2.png
点击Start Analysis进入下一页面。

3.png
依次真好箭头所指内容，最后点击提交。

4.png
点击箭头处开始分析。

5.png

6.png
点击Chart进入下载页面

7.png

8.png
Ctrl+A进行全选再复制到一个TXT文件，然后用excel就可以打开了。

9.png
打开后会发现Term这一列前面有GO数据自己的一个编号，点击分列

10.png
这样就分开了，接下来画一个气泡图

rm(list = ls())
options(stringsAsFactors = F)

library(ggplot2)
data=read.csv("./go_bp.csv")
data$GeneRatio <- data$Count / data$List.Total
data <- data[order(-data$PValue),]
data$pathway <- factor(data$Term,levels=data$Term)

#画图
p = ggplot(data,aes(GeneRatio,pathway))
p=p + geom_point()+theme(axis.text.x = element_text(colour="black",size=1))  
p=p + geom_point(aes(size=Count))
pbubble = p+ geom_point(aes(color=PValue,size=Count))
pr = pbubble+scale_color_gradient(low="red",high = "green")
pr = pr+labs(color=expression(PValue),size="Count",  
             x="GeneRatio",y="")
pr + theme_bw()

11.png

同理也可以做出KEGG的图，当然这里需要去除掉PValue大于0.05的Term，这里只作演示就没有去掉了，这里可以根据自己需要去选择自己想要展示的Term。

GEO数据挖掘

GEO数据挖掘（一）数据下载及基因ID转换

GEO数据挖掘（二）基因差异分析

GEO数据挖掘（三）使用DAVID数据库进行GO、KEGG富集分析

GEO数据挖掘（四）使用STRING数据库进行PPI分析

GEO数据挖掘（三）使用DAVID数据库进行GO、KEGG富集分

猜你喜欢

热点阅读