R 数据可视化 —— ggplot 坐标系
前言
ggplot2
包含 6
种不同的坐标系:
-
coord_cartesian
: 笛卡尔坐标系 -
coord_fixed
: 固定 "纵横比" 的笛卡儿坐标 -
coord_flip
:x
和y
翻转的笛卡尔坐标 -
coord_trans
: 变换笛卡尔坐标系 -
coord_map/coord_quickmap
: 地图 -
coord_polar
: 极坐标系
1. 笛卡尔坐标系
1.1 coord_cartesian
coord_cartesian(
xlim = NULL,
ylim = NULL,
expand = TRUE,
default = FALSE,
clip = "on"
)
笛卡尔坐标系是最常见的坐标系类型,在坐标系上限制数据范围会将图放大(就像你用放大镜看一样)。
注意:在前面使用标度函数来设置坐标轴范围时,会删除范围之外原始数据。
示例
对于如下的点图
p <- ggplot(mtcars, aes(disp, wt)) +
geom_point() +
geom_smooth()
p
我们有两种方式来进行缩放
# 范围之外的数据会被设置为 NA.
p1 <- p + scale_x_continuous(limits = c(325, 500))
# 不改变数据,只是放大某一范围
p2 <- p + coord_cartesian(xlim = c(325, 500))
plot_grid(p1, p2, labels = LETTERS[1:2])
我们可以看到,在 A
图中,由于范围之外的数据删除了,在范围之内的数据上计算平滑曲线,所以看到的曲线形状发生了改变,而 B
图保持与原图相同的形状。
可以设置 expand = FALSE
,不添加扩展因子,允许数据与坐标轴重叠
p1 <- p + coord_cartesian(xlim = c(325, 500), expand = FALSE)
p2 <- p + coord_cartesian(expand = FALSE)
plot_grid(p1, p2, labels = LETTERS[1:2])
类似地,对于如下热图
d <- ggplot(diamonds, aes(carat, price)) +
stat_bin2d(bins = 25, colour = "white")
d
两种缩放方式也是不一样的
p1 <- d + scale_x_continuous(limits = c(0, 1))
p2 <- d + coord_cartesian(xlim = c(0, 1))
plot_grid(p1, p2, labels = LETTERS[1:2])
1.2 coord_fixed
coord_fixed(ratio = 1, xlim = NULL, ylim = NULL, expand = TRUE, clip = "on")
coord_fixed
确保 x
轴和 y
轴具有相同的标度,即保证在任何情况下坐标轴的纵横比不变
默认是 1:1
(y:x
) 即参数 ratio = 1
,可以通过修改 ratio
参数的值来调整两者之间的比例。
示例
例如,对于默认的图形
p <- ggplot(mtcars, aes(mpg, wt)) + geom_point()
p
设置不同的 ratio
值
p1 <- p + coord_fixed(ratio = 1)
p2 <- p + coord_fixed(ratio = 5)
p3 <- p + coord_fixed(ratio = 1/5)
p4 <- p + coord_fixed(xlim = c(15, 30))
plot_grid(p1, p2, p3, p4, labels = LETTERS[1:4], nrow = 4)
1.3 coord_flip
默认情况下,坐标系以横轴为 x
轴,纵轴为 y
轴。对于某些情况下,想要对 x
轴与 y
轴进行翻转,可以使用 coord_flip
。
coord_flip(xlim = NULL, ylim = NULL, expand = TRUE, clip = "on")
示例
箱线图翻转
p1 <- ggplot(diamonds, aes(cut, price)) +
geom_boxplot()
p2 <- ggplot(diamonds, aes(cut, price)) +
geom_boxplot() +
coord_flip()
plot_grid(p1, p2, labels = LETTERS[1:2], nrow = 2)
直方图翻转
h <- ggplot(diamonds, aes(carat)) +
geom_histogram()
h1 <- h + coord_flip()
h2 <- h + coord_flip() + scale_x_reverse()
plot_grid(h, h1, h2, labels = LETTERS[1:3], nrow = 3)
面积翻转
df <- data.frame(x = 1:5, y = (1:5) ^ 2)
p1 <- ggplot(df, aes(x, y)) +
geom_area()
p2 <- p1 + coord_flip()
plot_grid(p1, p2, labels = LETTERS[1:2], nrow = 2)
1.4 coord_trans
coord_trans(
x = "identity",
y = "identity",
xlim = NULL,
ylim = NULL,
limx = "DEPRECATED",
limy = "DEPRECATED",
clip = "on",
expand = TRUE
)
在前面的章节中,我们使用标度函数来对数据值进行转换后绘制,但是 coord_trans
的转换方式与其不同,它的转换发生在统计变换之后。
coord_trans
的转换会影响几何对象的形状,可能原本的直线在变换之后变成了曲线
示例
我们可以比较一下 ggplot2
中的三种转换方式
dsamp <- diamonds[sample(nrow(diamonds), 1000),]
p1 <- ggplot(dsamp, aes(log10(carat), log10(price))) +
geom_point()
p2 <- ggplot(dsamp, aes(carat, price)) +
geom_point() +
scale_x_log10() +
scale_y_log10()
p3 <- ggplot(dsamp, aes(carat, price)) +
geom_point() +
coord_trans(x = "log10", y = "log10")
plot_grid(p1, p2, p3, labels = LETTERS[1:3], nrow = 3)
A
图和 B
图,我们在之前的例子已经说明了,虽然三种方式的图形是一样的,但是图 A
的坐标轴范围是根据转换后的值确定的。而图 B
保留了原始数据的坐标范围,图 C
的坐标轴之间的距离经过对数变换变换之后像是被拉扯过一样,前面的间距宽,后面的间距窄,但是数据还是原来的。
坐标轴变换与标度函数变换的区别是,标度函数的变换发生在统计计算之前,而坐标轴变换是发生在统计计算之后。
例如,我们为散点图添加一条拟合曲线
d <- subset(diamonds, carat > 0.5)
p1 <- ggplot(d, aes(carat, price)) +
geom_point() +
geom_smooth(method = "lm") +
scale_x_log10() +
scale_y_log10()
p2 <- ggplot(d, aes(carat, price)) +
geom_point() +
geom_smooth(method = "lm") +
coord_trans(x = "log10", y = "log10")
plot_grid(p1, p2, labels = LETTERS[1:2], nrow = 2)
在图 B
中,原来的直线由于坐标轴的变换被拉扯成曲线了
这样就可以组合标度函数和坐标变换来进行逆变换
p1 <- ggplot(dsamp, aes(carat, price)) +
geom_point() +
geom_smooth(method = "lm")
p2 <- ggplot(dsamp, aes(carat, price)) +
geom_point() +
geom_smooth(method = "lm") +
scale_x_log10() +
scale_y_log10() +
coord_trans(x = scales::exp_trans(10), y = scales::exp_trans(10))
plot_grid(p1, p2, labels = LETTERS[1:2], nrow = 2)
2. 极坐标系
极坐标系最常用于绘制饼图,饼图其实就是极坐标下的堆叠条形图
还可以用于绘制雷达图(直线图)、玫瑰图(条形图)等
coord_polar(theta = "x", start = 0, direction = 1, clip = "on")
其中,theta
参数用于指定变换为角度的坐标轴,默认为 x
轴。
示例
绘制简单的饼图
pie <- ggplot(mtcars, aes(x = factor(1), fill = factor(cyl))) +
geom_bar(width = 1)
p1 <- pie + coord_polar(theta = "y")
cxc <- ggplot(mtcars, aes(x = factor(cyl))) +
geom_bar(width = 1, colour = "black")
p2 <- cxc + coord_polar()
plot_grid(pie, p1, cxc, p2, labels = LETTERS[1:4], nrow = 2)
更改变换为角度的轴,将会是什么样子的呢
# 不知道什么图
p3 <- cxc + coord_polar(theta = "y")
# 牛眼图
p4 <- pie + coord_polar()
plot_grid(p3, p4, labels = LETTERS[1:2], nrow = 1)
绘制百分比图
# 绘制百分比图
df <- data.frame(
variable = c("does not resemble", "resembles"),
value = c(20, 80)
)
ggplot(df, aes(x = "", y = value, fill = variable)) +
geom_col(width = 1) +
scale_fill_manual(values = c("red", "yellow")) +
coord_polar("y", start = pi / 3) +
labs(title = "Pac man")
3. 地图
coord_map()
使用 mapproj
包定义的投影,将地球的一部分(近似为球形)投影到 2D
平面上。
一般来说,地图投影不会保留直线,所以这需要大量的计算。而 coord_quickmap
是一种保留直线的快速近似方法。它最适合靠近赤道的小区域
示例
地图的平面展示
nz <- map_data("nz")
# Prepare a map of NZ
nzmap <- ggplot(nz, aes(x = long, y = lat, group = group)) +
geom_polygon(fill = "white", colour = "black")
# Plot it in cartesian coordinates
nzmap
变换为地图投影
nzmap + coord_map()
使用 coord_quickmap
nzmap + coord_quickmap()