R循环画图
1.R画图
R是我们做生信进行图形展示较为常用的软件,我们在经常使用R进行数据展示,画一个或者几个图,但我们做生信的,批量化是我们最重要的目标之一。比如有时候可能有几万个图需要画,我们不可能一个一个的去画图,这时候就需要进行批量画图。
2.R循环画图
R循环画图循环画图挺简单,主要是在dev.off()之前,加上一句print(p)即可,这里的p为画图对象,如下所示:
for (i in cluster){
name<-paste(i,'cluster_VlnPlot',sep='_')
mkdirs(paste(outdir,'3_marker',sep='/'),name)
for(m in 1:nrow(all.markers)){
if (all.markers["cluster"][m,]==i){
filename<-paste(gene.list[m],'VlnPlot.pdf',sep='_')
graph <- paste(name,filename,sep='/')
pdf(graph, w=12, h=8)
p<-VlnPlot(object = immune.combined, features.plot = c(gene.list[m]), return.plotlist=TRUE,point.size.use = -1,cols.use=color,size.x.use = -1)
print(p)
plot_grid(p)
dev.off()
}
}
}
这里print(p)是循环的关键
2.try语句画图
我们在画图或者操作的时候,可能有时候某个基因不在我们已有的文件,我们直接循环画图,将会出现报错,而且这个报错后面所有的图都将无法正常完成,因此这里需要使用try语句,如果报错,直接打印报错信息,并且跳过此图,直接画下一幅图,比如:
for (i in 1:cluster_num){
tryCatch({gene<-read.table(paste(i,"diff_gene_condition.csv",sep="_"),sep=",",header = TRUE,row.names = NULL)
graph <- paste(prefix,i,'_diff_featureHeatmap.pdf',sep='_')
pdf(graph,w=12, h=8)
gene_FeatureHeatmap<-c()
if (length(gene[,1]) >=6){
gene_FeatureHeatmap<-as.vector(gene[,1][1:6])
}else{
gene_FeatureHeatmap<-as.vector(gene[,1])
}
p<-FeatureHeatmap(immune.combined, features.plot = gene_FeatureHeatmap, group.by = "stim", pt.size = 0.25, key.position = "top",max.exp = 3,do.return =TRUE)
print(p)
plot_grid(p)
dev.off()
},error=function(e){print(paste(i,"--聚类不在某个组中,差异分析画所有聚类的热图出现错误",sep=""))} )
}
这里主要使用的语句为:tryCatch({},error=function(e){print(报错信息)} )
这个是我的第一版的try语句画图,并且也成功运行过很多次,包括循环分析、差异分析。
3.第二版循环画图
第一版画图,其实是有bug,只是一直没有遇到画图报错的循环,某次,我再运行这个脚本,其中某个基因的数据在我们画图文件中不存在,结果直接报错,画不出来图,报错信息如下:
开始一直不知道原因,后面通过查询报错信息,找到原因(https://stackoverflow.com/questions/24207960/too-many-open-devices-r),原来是因为报错的时候,pdf文件已经建立,但是没有关闭,如果循环太多,将会出现Too many open devices r信息。
输入命令:dev.list()
# tiff jpeg tiff jpeg tiff jpeg tiff jpeg tiff tiff tiff tiff tiff jpeg tiff tiff tiff # 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
得到如上的信息,说明还有十几张图还没有关闭,使用dev.off()关闭十几次后,就可以正常画图了。
找到原因了,那就得解决,这里的解决方案就是在报错的时候,我们在关闭一下图片文件,并且删掉改文件,打印报错信息,就解决此问题,具体命令如下:
if (opt$gene=='yao'){
print('没有输入特定的基因做小提琴图和箱线图,continue!')
}else{
print("输入了特别的基因,将对特定的基因进行热图和小提琴图")
costmer_gene_file<-read.table(opt$gene,sep='\t')
costmer_gene<-unique(costmer_gene_file[,1])
mkdirs(outdir,'3_marker/costmer_gene/')
setwd(paste(outdir,'3_marker/costmer_gene',sep='/'))
for (m in 1:length(costmer_gene)){
tryCatch({
print("开始进行特定的基因表达量分布图绘制。。。。。。。。")
filename<-paste(costmer_gene[m],'FeaturePlot.pdf',sep='_')
pdf(filename, w=12, h=8)
p<-FeaturePlot(object =immune.combined, features.plot = as.character(costmer_gene[m]), min.cutoff = "q9", pt.size = 0.5,cols.use = c("lightgrey","blue"))
print(p)
dev.off()
},error=function(e){
dev.off()
print(paste(costmer_gene[m],"--不在分析分析结果中,基因表达量分布图出现错误,请注意核对",sep=""))
cmd<-paste('rm ',filename,sep=' ')
system(cmd)
} )
}
for (m in 1:length(costmer_gene)){
tryCatch({
print("开始进行特定的基因进行小提琴图绘制。。。。。。。。")
filename<-paste(costmer_gene[m],'VlnPlotPlot.pdf',sep='_')
pdf(filename, w=12, h=8)
p<-VlnPlot(object = immune.combined, features.plot = as.character(costmer_gene[m]), return.plotlist=TRUE,point.size.use = -1,cols.use=color,size.x.use = -1)
print(p)
dev.off()
},error=function(e){
dev.off()
print(paste(costmer_gene[m],"--不在分析分析结果中,基因表达小提琴图出现错误,请注意核对",sep=""))
cmd<-paste('rm ',filename,sep=' ')
system(cmd)
} )
}
cmd<-paste('ls ',paste(outdir,'3_marker/costmer_gene',sep='/'),'/*.pdf|while read i;do convert $i `dirname $i`/`basename $i .pdf`.png ;done',sep='')
print(cmd)
system(cmd)
}
到此,循环画图没有问题了。
2019年1月22日