生物信息学Cook R生物信息学

《ggplot2:数据分析与图形艺术》笔记3:用图层构建图像

2018-01-02  本文已影响48人  曹务强

在前面的练习中,我们使用qplot练习作图,作为ggplot2的快速入门。然而,qplot的局限性在于它只能使用一个数据集和一组图形属性映射,当我们要进行复杂数据的统计分析时,qplot就不够用了。解决这一问题的方法就是使用图层,每一个图层可以有属于自己的数据集和图形属性映射,附加的数据元素可以通过图层添加到图形中。

创建绘图对象

当我们调用qplot()时,它其实为我们做了许多幕后工作:

  1. 创建一个图形对象
  2. 添加图层并展示结果
    如果想手动创建图形对象,就要使用ggplot()函数。该函数有两个主要的参数:数据和图形属性映射
    数据:指定绘图所使用的默认数据集(必须是数据框)
    映射:将图形属性和变量名放在函数aes()的括号中即可创建映射

比如,通过下面的代码,即可创建一组默认映射:

#x为carat,y为price,colour为cut
p <- ggplot(diamonds, aes(carat, price, colour = cut))

不过,上面的图形对象在加上图层之前是无法显示的。

图层

创建好绘图对象后,我们可以使用+来添加图层:

p + geom_point()

再通过添加图层而添加几何对象时,我们需要注意:每一个几何对象都对应着一个默认的统计变换和位置参数,而每一个统计变换都对应着一个默认的几何对象参数。所以对于一个图层,我们只需要设定stat或geom参数即可。

数据

图形属性映射

aes()函数用来将数据变量映射到图形中,从而使变量成为可以被感知的图形属性。
aes()函数中有一系列的图形属性参数:

#创建映射
aes(x = weight, y = height, colour = age)
#x,y可以省略,直接输入映射值
aes(weight, height, colour = age)

几何对象

几何对象,简称为geom,它执行着图层的实际渲染,控制着生成的图像类型。

统计变换

统计变换。简称为stat,即对数据进行统计变换,它通常以某种方式对数据信息进行汇总。

ggplot(diamonds, aes(carat)) + geom_histogram(aes(y = ..density..), binwidth = 0.1)

位置调整

位置调整:是对图层中的元素位置进行微调。位置调整一般多见于处理离散型数据,连续型数据一般很少出现完全重叠的问题。

常用的位置调整参数见下图:


整合

一旦熟悉了图层操作,就可以把本章所介绍的各种图层功能结合起来,轻松做出复杂的图形。

结合几何对象和统计变换

将几何对象和不同的统计变换进行组合,可以轻松做出新颖的图形。下面,我们基于相同的直方图的统计变换,使用不同的几何对象,以不同的形式来展示结果:面积、点和瓦块图。

# 创建绘图对象
d <- ggplot(diamonds, aes(carat)) + xlim(0,3)
# 对数据进行统计变换,并绘制面积图层
d + stat_bin(aes(ymax = ..count..), binwidth =0.1 , geom ="area")
# 对数据进行统计变换,并绘制点图图层
d + stat_bin(aes(size = ..density..), binwidth = 0.1, geom = "point"
, position = "identity")
# 对数据进行统计变换,并绘制瓦块图图层
d + stat_bin2d(aes(y = 1, fill = ..count..), binwidth = 0.1, geom = "tile", position = "identity")

绘制面积图图层:


Rplot01.png

绘制点图图层:


Rplot02.png

绘制瓦块图图层:


Rplot03.png
上一篇下一篇

猜你喜欢

热点阅读