科研信息学遗传学R语言

跟着Nature Ecology&Evolution学数据分析:

2021-10-13  本文已影响0人  小明的数据分析笔记本

关于方差分解的内容之前已经分享过两篇推文
之前的推文分享过一篇

内容是重复了一篇 Nature Ecology&Evolution期刊论文的方差分解过程,虽然对运行过程还是不太理解,但是能得到结果。今天的推文我们利用得到的结果复现一下论文中的Figure4a

image.png

前面的计算过程可以参考推文

现在是假设我们已经拿到了计算结果,需要作图,组图用到的示例数据如下

image.png

这里不再提供示例数据和代码的下载链接,因为发现有人用我的推文的示例数据和代码写公众号,他还申请原创,有点过分了

(如果需要示例数据和代码的话可以留言,实名制 加我的微信)

读取数据

df<-read.csv("mydf.csv",check.names = F)
df

准备配色

cols<-c("#9832cb","#6a8d23","#fc0000","#4776fd","#f2a260")

首先是左侧的点线图


library(tidyverse)
library(ggplot2)
library(ggh4x)

df %>% 
  mutate(group=fct_relevel(group,
                           c("Geo","Abiotic","Richness","Mean/Var","Skew/Kurt"))) %>% 
  group_by(group) %>% 
  arrange(Estimate,.by_group = T) %>% 
  mutate(var=fct_relevel(var,var)) %>% 
  mutate(signi=case_when(
    `Pr(>|z|)` > 0.05 ~ '',
    `Pr(>|z|)` < 0.05 & `Pr(>|z|)` >= 0.01 ~ '*',
    `Pr(>|z|)` < 0.01 & `Pr(>|z|)` >= 0.001 ~ '**',
    `Pr(>|z|)` < 0.001 ~ '***'
  )) %>% 
  ggplot(aes(x=Estimate,y=var))+
  geom_linerange(aes(xmin=Estimate-`Std. Error`,
                     xmax=Estimate+`Std. Error`,
                     color=group))+
  geom_point(aes(color=group))+
  theme_minimal()+
  labs(x="Parameter Estimate",y=NULL)+
  scale_x_continuous(limits = c(-0.2,0.3),
                     breaks = c(-0.2,-0.1,0,0.1,0.2))+
  guides(x=guide_axis_truncated(trunc_lower = -0.2,
                                trunc_upper = 0.2))+
  theme(axis.text.y = element_blank(),
        axis.ticks.y = element_blank(),
        panel.grid = element_blank(),
        axis.line.x = element_line(),
        axis.ticks.x = element_line(),
        legend.position = "none")+
  scale_color_manual(values = rev(cols))+
  geom_text(aes(x=0.15,label=var),
            hjust=0,parse = T)+
  geom_text(aes(x=0.25,label=signi))
image.png

然后是右侧的堆积柱形图

df %>% 
  mutate(group=fct_relevel(group,
                           rev(c("Geo","Abiotic",
                              "Richness","Mean/Var",
                              "Skew/Kurt")))) %>% 
  group_by(group) %>% 
  summarise(sum_value=sum(abs(Estimate))) %>% 
  mutate(new_col=sum_value/sum(sum_value)) %>% 
  ggplot(aes(x=1,y=new_col,label=group))+
  geom_col(aes(fill=group),
           show.legend = F)+
  scale_fill_manual(values = cols)+
  scale_y_continuous(expand = c(0,0))+
  theme_minimal()+
  theme(axis.text.x = element_blank(),
        axis.title.x = element_blank(),
        axis.line.y = element_line(),
        axis.ticks.y = element_line(),
        plot.title = element_text(hjust=0.5))+
  labs(y="Relative efect of estimates (%)",
       title = expression(Adj.R^2==0.66))+
  geom_text(aes(x=1,
                y=rev(c(0.03,0.25,0.43,0.6,0.8)),
                label=group))
image.png

最后是拼图

library(patchwork)

p2+p1+plot_layout(widths = c(0.5,3))
image.png

这个就是最终的结果,论文中原图有的文字是斜体,这个用代码实现暂时想不到比较好的办法了,可以出图后手动编辑

如果需要推文示例数据和代码可以在推文下方留言,实名制加我的微信 我发送示例数据和代码的下载链接

欢迎大家关注我的公众号

小明的数据分析笔记本

小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!

上一篇下一篇

猜你喜欢

热点阅读