Tableau中的三组基本/核心概念
2020-10-27 本文已影响0人
客户体验实验室
最近在系统学习Tableau,B站上也搜了一些视频教程,无论是官方还是非官方,大多都是一上来做什么什么图表,看着酷炫的可视化,总是有一些基本概念萦绕着不解。但似乎没有太多人重视这些基本概念,着实让我惊讶!就像看Tufte的定量数据的可视化,完全跟软件操作没关系,但如果你懂了他在讲图表可视化的基本逻辑,软件工具就都只是将这些概念和原理可操作化,那样你应该会理解更深。但愿吧,在这个浮躁、太看重眼前利益的世界里,庆幸也还有你做个读者,看我写的这些文字。
Tableau在Tableau的英文Elearning教程里,在初级课程前,是还有一门基础课的,中文界面里只有初、中和高三个基本课程。正是这个我本来也要忽略的小白课程中谈到了这3组概念。
- Dimensions与Measures数据分类:维度数据通常对应类别数据,与命名或名称量表对应,是定性类数据,通常描述类别,告诉你what, who, when等信息;而顺序、等比和等距量表对应的数字,通常会被Tableau读取为测量数据,是定量数据。维度通常是测量数据的观察视角,可视化中视觉编码通常对应的便是维度(测量也可进行视觉编码,如颜色,但与维度在tableau中呈现方式有差异,表现为渐变)
- Granularity与Aggregation:数据粒度即数据的详细程度,对于Tableau视图中可视化的测量值,通常都以某种聚合方式展示,如默认的SUM。这样你其实是在俯视视角看数据,看不到细节,此时你可以慢慢加入维度作为编码,从而降低观察角度,看到维度代表的这一层数据细节。当然如果你放进的是代表每个值的个体维度,你就看到了数据最底层。
- Discrete与Continuous:离散型、连续型数据与维度和测量并不完全对等,在维度值中也可以有连续值,如时间;测量值也不完全是连续的,如时间。Tableau中通常把离散值对应分类标签,总之是类别,无论坐标轴还是不同颜色、大小等视觉编码都是如此,对应视图区域的蓝色胶囊;而连续值对应坐标轴,或筛选、编码呈现方式中的连续区间,视图区域显示为绿色胶囊。