GEO数据挖掘(三)使用DAVID数据库进行GO、KEGG富集分

2022-07-03  本文已影响0人  生信开荒牛

首先整理好前面已经处理好的差异基因数据,部分基因截图如下:

1.png
打开DAVID网站: https://david.ncifcrf.gov/home.jsp
2.png
点击Start Analysis进入下一页面。
3.png
依次真好箭头所指内容,最后点击提交。
4.png
点击箭头处开始分析。
5.png
6.png
点击Chart进入下载页面
7.png
8.png
Ctrl+A进行全选再复制到一个TXT文件,然后用excel就可以打开了。
9.png
打开后会发现Term这一列前面有GO数据自己的一个编号,点击分列
10.png
这样就分开了,接下来画一个气泡图
rm(list = ls())
options(stringsAsFactors = F)

library(ggplot2)
data=read.csv("./go_bp.csv")
data$GeneRatio <- data$Count / data$List.Total
data <- data[order(-data$PValue),]
data$pathway <- factor(data$Term,levels=data$Term)

#画图
p = ggplot(data,aes(GeneRatio,pathway))
p=p + geom_point()+theme(axis.text.x = element_text(colour="black",size=1))  
p=p + geom_point(aes(size=Count))
pbubble = p+ geom_point(aes(color=PValue,size=Count))
pr = pbubble+scale_color_gradient(low="red",high = "green")
pr = pr+labs(color=expression(PValue),size="Count",  
             x="GeneRatio",y="")
pr + theme_bw()
11.png

同理也可以做出KEGG的图,当然这里需要去除掉PValue大于0.05的Term,这里只作演示就没有去掉了,这里可以根据自己需要去选择自己想要展示的Term。

GEO数据挖掘

GEO数据挖掘(一)数据下载及基因ID转换

GEO数据挖掘(二)基因差异分析

GEO数据挖掘(三)使用DAVID数据库进行GO、KEGG富集分析

GEO数据挖掘(四)使用STRING数据库进行PPI分析

上一篇下一篇

猜你喜欢

热点阅读