数据可视化笔记-R语言

2019-03-25  本文已影响0人  farland

<<Data Visualization and Exploration with R>> by Eric Pimpler

定义

Exploratory Data Analysis (EDA)
目的:理解数据
步骤:

  1. 产生问题
  2. 对数据进行可视化,并寻找答案
  3. 改进或提出新的问题

数据类型

可视化的用途

发现变量的变化或多个变量之间的共变(variation or covariation)

方法

Covariation is the tendency for the values of two or more variables to vary together in a related way. The best way to spot covariation is to visualise the relationship between two or more variables

条形图示例 bar plot

diamonds-颜色条形图

X轴 = 离线变量-color,Y轴 = 每种颜色的钻石数量

直方图示例

diamonds-价格-直方图

X轴 = 连续变量-price, Y轴=每种价格的频率/数量

箱体图示例

diamonds-品质-价格

X轴 = 离线变量-cut品质,Y轴 = 价格,可以比较每种品质钻石的价格分布,比如中位值,离群值等

符号大小

diamonds,品质,颜色数量对比

散点图示例

diamonds 重量和价格对比
上一篇 下一篇

猜你喜欢

热点阅读