Tableau基础知识

2018-04-29  本文已影响0人  李慕玄

1.文件与数据

Tableau使用的数据结构必须是标准的关系型数据库中的二维表结构。

1.1 Tableau文件类型

文件类型 文件大小 使用场景 具体内容
数据源.tds 频繁使用的数据源 完整的数据源定义
数据提取.tde 数据源为远程,希望提高库性能 筛选出的部分或完整的源数据本地副本
工作薄.twb 默认保存方式 仅包括数据源定义和可视化图表定义,无源数据
工作薄.twbx 与无法访问源数据的用户分享工作结果 所有信息和源数据

1.2 数据整理操作

1.3 重复测量数据的记录方式

1.4 纬度和度量

纬度:对应(无序/有序)分类变量,用于对案例进行分组

度量:对应连续变量,在图表中呈现为原始信息或汇总信息

2.制表

2.1 表格类型

叠加表(Stacking)


屏幕快照 2018-04-29 22.12.42.png

交叉表(Crosstabulation)

嵌套表(Nesting)


屏幕快照 2018-04-29 22.18.34.png

多层表(Layers)


屏幕快照 2018-04-29 22.23.34.png

复合表

2.2 制表步骤

  1. 确定表格结构与行列构成,是否在表格中出现多个元素的嵌套,有多少种汇总,是否有嵌套汇总等。
  2. 绘制表格的基本结构。
  3. 完善细节,使单元格的输出格式符合要求。
  4. 添加其余变量、统计量到表格中。
  5. 对表格的附加文本和格式进行修饰。
  6. 最后审核绘制的表格,查缺补漏。

3.绘图

3.1 统计图的分类框架

  1. 根据呈现变量的数量,将统计图分为单变量图、双变量图和多变量图。
  2. 根据相应变量的测量尺度进行更细划分。

3.2 单个-分类变量

3.3 单个-数值变量

直方图

  1. 对数值进行分组频数汇总,呈现整个取值区间上的数据分布特征。
  2. Tableau是通过对原始数据生成分段变量(数据图)来实现。

箱图

  1. 使用百分位数体系刻画整个取值区间。
  2. 箱体最中间的粗线为P50(中位数),方框上下界为P75和P25(四分位数)。
  3. 数据用散点的方式表示。
  4. 与四分位数(即方框上下界)的距离超过1.5倍四分位间距(即方框长度)的都会被定义为离群值,相应的界限在图中以线段表示。
  5. 所有数值均未超界时,该线段就是最大/最小值。

3.4 数值因变量

3.5 分类因变量

3.6 更复杂的图形

上一篇 下一篇

猜你喜欢

热点阅读