R语言绘制箱线图分面并添加文本注释(基础知识)
2021-11-24 本文已影响0人
单细胞空间交响乐
hello,大家好,今天分享一个简单的内容,我们实现下面的这张图
图片.png参考文献在
图片.png这张图实现的箱线图,分面并注释,好看的图胜过千言万语,我们来实现它。
嵌套分面已经有集成的R包了,ggh4x包,学习一下即可。
加载R包和数据
library(ggh4x)
library(ggplot2)
library(reshape2)
library(tidyverse)
####示例数据可以从文献链接处下载
input = read.delim('示例数据',header = T)
head(input,3)
图片.png
###宽转长
df = melt(input,id.vars = c('Precursor','Dataset','Model'))
head(df,3)
图片.png
###因子化排序
df$Model = factor(df$Model,levels = c('DeepPhospho','pDeep2','DeepMS2','MS2PIP'))
设置嵌套背景
设置一下填充色和边框颜色
###背景
strip = strip_nested(background_x = elem_list_rect(fill = c(rep('grey',2),
rep(c('#F58840','#9AE66E'),2)),color = rep('white',6)))
基础绘图
这里使用expansion来扩展x轴,防止插入每个分面图最后一列文字跑出去:
###绘图
p = ggplot(df,aes(x = Model,y = value,fill = Model)) +
##误差线
stat_boxplot(aes(x = Model,y = value),
geom = 'errorbar',width = 0.3) +
###箱线图层
geom_boxplot(outlier.shape = NA , width = 0.5 ) +
theme_bw(base_size = 16) +
##主题调整
theme(panel.grid = element_blank(),
axis.text.x = element_blank(),
axis.ticks.x = element_blank(),
legend.position = 'bottom') +
xlab('') + ylab('') +
ylim(-0.5,1) +
##自定义颜色
scale_fill_manual(values = c('#BFA2DB','#F58840','#CDF2CA','#9D9D9D'),
name = ' ') +
##x轴扩展
scale_x_discrete(expand = expansion(mult = c(0.2,0.3))) +
###嵌套分面
facet_nested(~Dataset + variable,scales = 'free_y',axes = 'all',
strip = strip)
p
图片.png
统计数据
图中的文本注释为每个分组的数据的中位数及对应的数量,我们需要统计一下:
图片.png循环统计
fin = list()
for (i in names(table(df$Model))){
tmp1 = df %>% filter(Model == i)
for (j in names(table(df$variable))){
tmp2 = tmp1 %>% filter(Dataset == k)
res = round(median(tmp3$value,na.rm = T),digits = 3)
n = round(length(tmp3$value),digits = 0)
fin[[paste(i,j,k,sep = ' ')]] <- c(n,res)
}
}
}
##整合数据
fin_res= fin %>% do.call('rbind',.) %>% dara.frame()
###查看数据
head(fin_res,3)
图片.png
接下来添加分组变量及标签的x,y坐标:
###x坐标
fin_res$x = c(rep(1.5,4),rep(2.5,4),rep(3.5,4),rep(4.5,4))
###y坐标
fin_res$y= 0.65
#添加标签
fin_res$label = paste(fin_res$X2,"| n = ",fin_res$X1 , sep = '')
#添加变量
fin_res$Model = rep(names(table(fin_res$Model)),each = 4)
fin_res$variable = rep(c('PCC','PCC','SA','SA'),4)
fin_res$Dataset = rep(c('RPE1 DDA','RPE1 DIA'),8)
#查看数据
head(fin_res,3)
图片.png
添加标签
p +
geom_text(data = fin_res,
aes(x = x , y = y,label = label),
##文本的角度及大小
angle = 90, size = 4 )
图片.png
生活很好,有你更好