R语言可视化之ggplot2——GO富集分析

2020-06-19 本文已影响0人 zrh_h

自学生信两个月了，都是自己在网上东找找西找找，总觉得连门都没入。总说最高效的学习方法就是输出，而最好的输出就是教别人。当然给别人讲课我还远远达不到，但自己学完，写下来，也算是一种输出了吧。

1. 数据准备

DAVID是一个可以做ID转换、富集分析等多种生信分析的综合数据库。

以DAVID上的GO分析结果为例，主要需要Category，Term，Count，FDR，Fold Enrichment这几列。

随便用几个基因举例子，正常的数据中应取FDR<0.05，但是由于是随机挑选的基因，这里就用PValue代替了

2. 作图

library(ggplot2)
go<-read.table(file = "go.txt",header = T,sep = "\t") #导入文件
ggplot(data = go)+
geom_bar(aes(y=reorder(Term,Count),x=Count,fill=-log(PValue)),stat='identity')+
 # Y轴为Term，以Count数排列，X轴为Count数；绘图函数里的stat参数表示对样本点做统计的方式，默认为identity，表示一个x对应一个y  
  scale_fill_gradient(expression(-log["10"](P.value)),low="blue",high="red")+
 # 设置图例
  ylab("")+
  xlab("Gene count")+ # 设置坐标轴名称
  theme_bw() # 设置背景

ggsave(filename = "go.png",height = 6,width = 10,units = "in",dpi=600) # 保存图片

结果如图

go.png

剩下的小细节可以根据自己的喜好修改啦，比如配色，字体，背景线等等。

R语言可视化之ggplot2——GO富集分析

1. 数据准备

2. 作图

结果如图

猜你喜欢

热点阅读