R可视化和ggplot2

《R数据可视化手册》学习笔记5---散点图(6)位置

2023-09-28  本文已影响0人  RSP小白之路

写在前面。


图形重叠

当数据集很大时,散点图中的点会相互重叠,为了避免这种情况,主要从以下角度考虑,调节点的透明度位置分箱。对于其他图形,还有别的方式。

位置

当散点图的其中一个轴或者两个轴对应离散型变量时,会出现重叠的现象。

示例数据ChickWeight数据集

> str(ChickWeight)
Classes ‘nfnGroupedData’, ‘nfGroupedData’, ‘groupedData’ and 'data.frame':  578 obs. of  4 variables:
 $ weight: num  42 51 59 64 76 93 106 125 149 171 ...
 $ Time  : num  0 2 4 6 8 10 12 14 16 18 ...
 $ Chick : Ord.factor w/ 50 levels "18"<"16"<"15"<..: 15 15 15 15 15 15 15 15 15 15 ...
 $ Diet  : Factor w/ 4 levels "1","2","3","4": 1 1 1 1 1 1 1 1 1 1 ...
 - attr(*, "formula")=Class 'formula'  language weight ~ Time | Chick
  .. ..- attr(*, ".Environment")=<environment: R_EmptyEnv> 
 - attr(*, "outer")=Class 'formula'  language ~Diet
  .. ..- attr(*, ".Environment")=<environment: R_EmptyEnv> 
 - attr(*, "labels")=List of 2
  ..$ x: chr "Time"
  ..$ y: chr "Body weight"
 - attr(*, "units")=List of 2
  ..$ x: chr "(days)"
  ..$ y: chr "(gm)"

这个时候可以调用position_jitter()给数据点增加随机扰动

ggplot(data = ChickWeight ,aes(x =Time, y = weight)) +
  geom_point( position =position_jitter(width = 0.5, height = 0))

上一篇下一篇

猜你喜欢

热点阅读