生信分析流程GSEA

GSEA富集分析的点状图画法(R)

2020-03-02  本文已影响0人  欧阳松

GSEA运行完以后默认出图较丑,而且只是png格式,不能改字体和大小,分辨率还是可怜的96dpi,就像下面这个图,远看可以,近看不行,远达不到SCI要求。

但其实知道原理的话,就是各种Excel表而已,有再次画曲线的,有再次绘制的,当然也可以画成Y叔clusterprofiler那样富集分析的柱状图和点状图,今天就介绍我最喜欢的点状图。
首先看表格内容,打开生成的文件夹,找到excel文件,主要是gsea_report_for_High_1574441392886.xlsgsea_report_for_Low_1574441392886.xls,具体文件名是看你自己定义的亚型和文件夹名,前缀是gsea_report_for_xx_yyxx是亚型,yy是文件夹名
比如你要分析其中的一个亚型,打开excel
表头显示如下

表头

仔细分析,我们需要的部分为NAME, SIZE,NES,NOM p-val,FDR q-val
一般有统计学意义的定义是NES>1或<-1及NOM p-val<0.05及FDR q-val<0.25,三者缺一不可,但是也可以只看p值或NES,看你需要什么样的结果,就保留什么结果,不然内容太多,也不好画图,我觉得10项就差不多了。

NAME里面有很少下划线,影响后期作图,所以建议画图前先处理,把前缀如“KEGG_”替换为空,把_替换成空格,(是空格,不是空,不把_后面替换为空格,后面无法改文本的长度),当然你可以把大小写改了,由于xls直接加载麻烦,所以建议保存为csv格式,一般不建议txt格式,因为csv读表直接有表头,可以省一点代码。
下面开始表演
打开Rstudio,加载目标文件夹

setwd("/Users/mac/Desktop/1574441392886/L/KEGG.Gsea.1574441392886/L") #自己看目录
#读表
kegg<-read.csv("kegg.csv")
kegg=as.data.frame(kegg)  #变矩阵,这行可以不执行
library(ggplot2) #加载神器
readcsv.jpeg

默认出图

p<-ggplot(kegg,aes(NES,NAME))+geom_point(aes(size=SIZE,color=NOM.p.val))
p
默认图,是不是一模一样了,但很丑

改颜色

#最少是红,最高是蓝,当然自己都可以改其他颜色,如绿色到紫色
p+scale_color_continuous(low='red' ,high='blue')
好看多了

改背景,最喜欢的bw

p+scale_color_continuous(low='red' ,high='blue')+theme_bw()
清清爽爽

是不是觉得文本太长了,缩短文本就可以了,比如我们想显示20个字母一行

library(stringr) #加载这个
p+scale_color_continuous(low='red' ,high='blue')+theme_bw()+scale_y_discrete(labels=function(y) str_wrap(y,width = 20))
缩短文本长度

是不是觉得点太小了,当然可以增大点,比如由5号到10号,记得不要贪大哦!

p+scale_color_continuous(low='red' ,high='blue')+theme_bw()+scale_y_discrete(labels=function(y) str_wrap(y,width = 20))+scale_size(range = c(5,10))
大大的点

一般GSEA有两个亚型,能不能一起显示?
答案是当时可以,打开另一个表,把需要的内容复制到原来的表,最后一例加一列,定义为phenotype即可,把自己定义的亚型填好,比如我的是High和Low,然后保存重新读一下表,重新画一下图,大于1为正,小于1为负。

kegg<-read.csv("kegg.csv")
p+scale_color_continuous(low='red' ,high='blue')+theme_bw()+scale_y_discrete(labels=function(y) str_wrap(y,width = 20))+scale_size(range = c(5,10))
两个亚型
当然也可以分面显示的
#分面显示一行
kegg<-read.csv("kegg.csv")
p+ facet_wrap(phenotype~.,scale="free")+scale_color_continuous(low='red' ,high='blue')+theme_bw()+scale_y_discrete(labels=function(y) str_wrap(y,width = 20))+scale_size(range = c(5,10))
行分面

也可以列分面

#分面显示一列
p+ facet_grid(phenotype~.,scale="free")+scale_color_continuous(low='red' ,high='blue')+theme_bw()+scale_y_discrete(labels=function(y) str_wrap(y,width = 20))+scale_size(range = c(5,10))
列分面

按照这个原理,如果做了多个分析,如GO,HALLMARK,reactome什么的,都可以往下添加,记得后面加一列分组,把内容加一下就好了,代码是一样的。

什么?不知道怎么导图?

ggsave("gsea.pdf",width=8,height=8)

宽和高自己慢慢调吧,图就在你的目录文件夹里

当然可以画柱状图,但是柱状图的信息要少一点,比如不能看size,而且图也比较丑,建议还是点状图。

写完睡觉!!
上一篇 下一篇

猜你喜欢

热点阅读