跟着Nature Genetics 学画图:R语言ggplot2
image.png论文是 Whole-genome resequencing of 445 Lactuca accessions reveals the domestication history of cultivated lettuce
这篇论文的数据是公开的,我们可以试着用公开的数据复现一下论文中用来展示数据的图。第一个图是使用地图来展示实验样本的地理分布。论文中写道 画图是使用ggplot2,作图数据来自 the Natural Earth dataset (http://www.naturalearthdata.com).
The world map was constructed using the R package ggplot2 with the Natural Earth dataset.
(http://www.naturalearthdata.com) 这个链接的数据怎么下载暂时没有搞明白。查了一下,发现R语言里有专门的包来获取这个地图数据,参考链接是 https://slcladal.github.io/maps.html
前几天的推文介绍了如何利用ggplot2包来绘制地图,有人在推文下留言说 地图上的边界存在问题 所以推文就删掉了。因为地图数据用的是老外搞得,经常会出现问题。大家使用地图的时候要格外注意。那这次演示就不用带有国家边界的地图了,也可以直接画以洲为边界的地图
加载需要用到的R包
library(rnaturalearthdata)
library(rnaturalearth)
library(ggplot2)
library(tidyverse)
#install.packages("regos")
library(rgeos)
获取画图的数据
world <- ne_coastline(scale = "medium",
returnclass = c("sf"))
上次的推文有人说这个部分代码被挡住了
画图
ggplot(data = world)+
geom_sf(fill="white") +
labs( x = "Longitude", y = "Latitude") +
# ggtitle("World map",
# subtitle = paste0("(",
# length(unique(world$admin)),
# " countries)"))+
theme_bw()+
theme(#plot.background = element_rect(fill = "aliceblue"),
panel.grid = element_blank(),
panel.background = element_rect(fill = "aliceblue"))+
labs(x=NULL,y=NULL)
这里遇到一个问题是不能够给地图区域的内部填充颜色,这个地方没有搞明白画地图的数据到底是什么样子的!
这个问题先留在这里了
如果想要展示局部地区,只需要指定xlim和ylim的范围就好了
ggplot(data = world)+
geom_sf(fill="red") +
labs( x = "Longitude", y = "Latitude") +
theme_bw()+
theme(panel.grid = element_blank(),
panel.background = element_rect(fill = "aliceblue"))+
labs(x=NULL,y=NULL)
coord_sf(xlim = c(-10, 80.00),
ylim = c(20.00, 70.00),
expand = FALSE)
image.png
接下来是叠加饼图
有现成的函数可以做这个事情,参考如下链接
https://guangchuangyu.github.io/2016/12/scatterpie-for-plotting-pies-on-ggplot/
需要借助scatterpie这个包
直接安装
install.packages("scatterpie")
看下帮助文档中的例子
help(package="scatterpie")
library(ggplot2)
library(scatterpie)
d <- data.frame(x=rnorm(5), y=rnorm(5))
d$A <- abs(rnorm(5, sd=1))
d$B <- abs(rnorm(5, sd=2))
d$C <- abs(rnorm(5, sd=3))
d
ggplot() +
geom_scatterpie(aes(x=x, y=y,r=0.3),
data=d,
cols=c("A", "B", "C")) +
theme_bw()+
scale_fill_manual(values = c("steelblue",
"yellowgreen",
"violetred1"))
image.png
这样就可以很方便的向地图上添加饼状图了
完整代码
#install.packages("rnaturalearth")
#install.packages("rnaturalearthdata")
help(package="rnaturalearth")
help(package="rnaturalearthdata")
library(rnaturalearthdata)
library(rnaturalearth)
library(ggplot2)
library(tidyverse)
#install.packages("regos")
library(rgeos)
world <- ne_coastline(scale = "medium",
returnclass = c("sf"))
d <- data.frame(x=sample(seq(0,80,10),5),
y=sample(seq(20,70,5),5))
d$A <- abs(rnorm(5, sd=1))
d$B <- abs(rnorm(5, sd=2))
d$C <- abs(rnorm(5, sd=3))
d
library(scatterpie)
# gene world map
ggplot(data = world)+
geom_sf(fill="red") +
labs( x = "Longitude", y = "Latitude") +
theme_bw()+
theme(panel.grid = element_blank(),
panel.background = element_rect(fill = "aliceblue"))+
labs(x=NULL,y=NULL)+
coord_sf(xlim = c(-10, 80.00),
ylim = c(20.00, 70.00),
expand = FALSE)+
geom_scatterpie(aes(x=x, y=y,r=3),
data=d,
cols=c("A", "B", "C")) +
theme_bw()+
scale_fill_manual(values = c("steelblue",
"yellowgreen",
"violetred1"))
image.png
这里还有一个问题是 这个地图为什么上下会出现很多空白区域呢,而不是占满整个画图区域呢?
如果需要今天图文的示例代码,直接在后台回复 20210423
就可以了
欢迎大家关注我的公众号
小明的数据分析笔记本
小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!