[2] 《R数据科学》绘图模板及练习

2020-10-26  本文已影响0人  灰常不错

上次的文章简单介绍了《R数据科学》,以及ggplot2中mpg的调取方式:
1.直接键入mpg
2.使用ggplot2::mpg来调取
这次我们来看,ggplot2的绘图模板,模板函数为:
ggplot(data = <data>)+<geom_function>(mapping = aes(<mappings>))
这个代码是无法运行的,只是一个模板,< >中的内容,<data>为读取的数据,<geom_function>为函数功能,比如geom_point就是绘制点集的,而<mappings>我们可以设置x和y的参数,比如,aes(x=displ,y=hwy),代表以displ为x,以hwy为y,当然这里可以简写为aes(displ,hwy)
接下来是一些练习题:
(1)运行ggplot(data = mpg),你会看到什么?
这个不会有任何效果,因为未使用功能函数<geom_function>画图。
(2)数据集mpg中有多少行?多少列?

image.png
A tibble: 234 x 11,代表234行11列
可以通过以下几种方式查询:
[1]dim(mpg)
[2]str(mpg)
[3]nrow(mpg)ncol(mpg)
[4]
library(tibble)
glimpse(mpg)
image.png
链接中包含了这四种查询方式:
http://www.360doc.com/content/20/0802/17/71039787_928162146.shtml

(3)变量drv的意义是什么?
drv是mpg数据框中的变量,我们采用?mpg,或者help(mpg)来查询它的意义,可以得到:
drv:the type of drive train, where f = front-wheel drive, r = rear wheel drive, 4 = 4wd,
驱动类型,前轮驱动,后轮驱动,四轮驱动。
(4)使用hwy和cyl绘制一张散点图。
万变不离其宗,直接套公式

ggplot(mpg)+geom_point(aes(hwy,cyl))

(5)如果使用class和drv绘制散点图,会发生什么情况?为什么这张图没有什么用处?


image.png

2个变量没有明显的相关性,且均为分类变量,失去可视化的意义

上一篇 下一篇

猜你喜欢

热点阅读