R学习与可视化SAS学习笔记R可视化和ggplot2

ggplot2回顾(1): 认识ggplot2

2019-09-29  本文已影响0人  TOP生物信息

1. 准备工作

library(ggplot2)
library(tidyverse)
#设置随机数种子,产生小数据集
set.seed(1410)
dsmall <- diamonds[sample(nrow(diamonds),100), ]

2. ggplot2画图尝试

diamonds %>% ggplot(aes(x=log(carat), y=log(price)))+geom_point()
diamonds %>% ggplot(aes(x=carat, y=x*y*z))+geom_point()

问题1:为什么是指数型的就需要这样转换:x和y同时取log?书中是这样写的,和我的认知不一致。

3. 关于图形属性

颜色,大小(size),形状,其他(alpha: 1完全不透明; 0完全透明)

dsmall %>% ggplot(aes(x=carat, y=price, colour=color))+geom_point()
dsmall %>% ggplot(aes(x=carat, y=price, shape=cut))+geom_point()
##这一步有什么提示信息。ordinal variable是指什么?
## Warning message:
##   Using shapes for an ordinal variable is not advised
dsmall %>% ggplot(aes(x=carat, y=price, shape=color))+geom_point()
##默认只能处理6种shape;当大于6个时只能手动定义shape

问题2:如何手动设置shape?
问题3:标度是什么?一个函数,作用是将数据的值映射到属性的值,比如cut有5个值,将这5个值依次对应上shape属性的5个值(就是具体的形状)

dsmall %>% ggplot(aes(x=carat, y=price, colour=color, size=dsmall$price))+geom_point()

问题4:什么时候映射到颜色和形状?什么时候映射到大小?

4. 几何对象

问题5:二维变量关系可以画哪些图?一维变量关系可以画哪些图?
点、线(曲线,折线)、箱型图(其中一维是离散的)
直方图、密度曲线、频率多边形;条形图

问题6:如何更改几何对象绑定的统计变换?以直方图为例

4.1 点线图
dsmall %>% ggplot(aes(x=carat, y=price))+geom_point()+geom_smooth()
dsmall %>% ggplot(aes(x=carat, y=price))+geom_point(aes(color=color))+geom_smooth(se=F, span=1)
##se=F表示不加标准误;span=1表示线尽可能直一些

问题7:请试试下面的代码,跟上面有一点点不同,为什么有这种不同?

dsmall %>% ggplot(aes(x=carat, y=price, color=color))+geom_point()+geom_smooth(se=F, span=1)
##再试试,跟上面一样吗?
dsmall %>% ggplot(aes(x=carat, y=price))+geom_point(aes(color=color))+geom_smooth(se=F, span=1, aes(color=color))

重要结论:在一个几何对象中,一个分类变量被映射到一个图形属性,几何对象会自动按照这个变量分类

4.2 箱型图

问题8:箱线图有哪些图形属性?

diamonds %>% ggplot(aes(x=color, y=price/carat))+geom_boxplot(colour="blue", fill="green", size=2)

问题9:为什么上面的代码中几何对象中没有用到aes()

4.3 直方图
ggplot(diamonds, aes(x=diamonds$carat))+geom_histogram(bins=100, fill="light blue")
ggplot(diamonds, aes(x=diamonds$carat, y=..density..))+geom_histogram(bins=100, fill="light blue")

问题10:上面两个都是直方图,有什么区别?

ggplot(diamonds, aes(x=diamonds$carat))+geom_density(color="light blue")

问题11:这个图和上面哪个图最像?第二个。如何组合直方图和密度图?如下

ggplot(diamonds, aes(x=diamonds$carat, y=..density..))+geom_histogram(bins=100, fill="light blue")+geom_density(color="light blue")

问题12:binwidth和bins的区别?

4.4 条形图
ggplot(diamonds, aes(x=diamonds$color))+geom_bar(aes(fill=diamonds$cut))
4.5 路径图
economics %>% ggplot(aes(x=unemploy/pop, y=uempmed))+geom_path(aes(colour=lubridate::year(date)))

问题13:结合书本上的结论理解上面的路径图

5. 分面

diamonds %>% ggplot(aes(x=carat, y=price))+geom_point()+facet_grid(color~cut)

6. 其他选项

dsmall %>% ggplot(aes(x=carat, y=price))+geom_point()+geom_smooth()+xlim(0,2)+ylim(0,15000)+xlab("重量")+ylab("价格")

7. 尝试一下,仍然是问题7的结论

ggplot(diamonds, aes(x=diamonds$carat))+geom_density(aes(color=diamonds$color, fill=diamonds$color), alpha=0.1)
ggplot(diamonds, aes(x=diamonds$carat))+geom_histogram(bins=100, aes(fill=diamonds$color))

reference

《ggplot2: 数据分析与图形艺术》

上一篇下一篇

猜你喜欢

热点阅读