数据可视化——Tableau数据连接

2019-03-02  本文已影响0人  bffbb3a8a646

                                                                            作者丨王炸

                                                          来源丨医数思维云课堂(ID:Datamedi)   

这一期,小编向大家介绍Tableau 数据连接,主要介绍Tableau 与各种数据源连接的基础知识,比如与文本文件、Excel、Access 文件、SQL Server、ODBC 数据源以及剪贴板的连接。讨论怎样使用筛选来减少可分析的数据,以及怎样合并两种不同的数据源。

01 数据源

可来自本地的Excel、Access、文本文档等,或者链接到外边的数据库兼容性超强。不列举了,看图:

数据源有了,开始导入吧!等等,需要注意的是,导入你的数据源之前最好做个清理,因为Tableau主打的不是数据清理而是成像啊~当然它内部也能对数据做一些简单删选、计算,但没有如Excel之类处理起来那么顺手。

所以最好导入的数据源是清理过的,比如首行已经是字段名,地理信息补全,日期字段已经转换成日期格式。

02  理解维度和度量

Tableau 把数据划分成两种主要的类型:维度和度量

维度通常是指那些不可被聚合的字段;度量,是可以被测量和聚合或者用于数学运算的字段。维度通常作为行列的字头;度量通常是指绘制或者给标记的大小赋值。

03 应用筛选器

数据分析过程,如果需要减少可供分析的数据或者在某个特定的字段值下过滤数据,应用筛选器是一个非常不错的方法。

筛选是一个较好处理工作表中数据的方式。根据字段数据类型,不同的筛选器类型可以应用到一个字段上。这些筛选器可以是用数字条件来限制数字字段或者用文本模式来限制字符串字段。

04 合并不同数据源

数据有时以不同格式或者不同文件存储。在关系数据库中,如果两个不同的表有相同的字段,我们可以用这个字段将这两个表合并在一起,并且通过一个查询中把数据提取出来。Tableau支持单一数据源连接的合并;然而为了合并多种数据源连接,Tableau使用数据混合

在同一个的工作表中,Tableau通过数据源的共有字段来创建关联,并运用关联来合并两个或两个以上的不同数据源。可以在关联中指定数据源中的共有字段,从而自定义混同操作。同时,这种混配不同于两个表的连接。因为当我们连接两个表时,我们创建的是行连接,并可以再这两个表中添加字段。

然而,在混配里,我们仅仅在单个可视化图形中显示不同数据源中的不同字段。

数据集的理想呈现方式:

每列是一个变量,在Tableau中称为字段,第一行包含列标题,其中每行包含数据的值。在连接到Tableau中可以检查列标题,从而确认文件格式是否正确。

切换到工作表时,可以在左侧窗格看到这些字段。

这种数据集很常见,但也有可能遇到略有不同的数据集。

实际表可能不在电子表格的左上角,而是在页面的其他位置。表格中有更多行或者列,其中可能有标题、说明或注脚。国际组织或政府机构发布的表中尤为常见,因为表格设计的初衷就是供人使用而不是供软件使用。

在Tableau中打开这个表,就可以发现这个表格没有列标题。此时,打开数据解释器,就可删除不属于表格的标题、说明、脚注。一个表中包含多个表时这种情况同样适用。

Tableau数据链接到这里就完成了,希望对大家能有所帮助,下一期我们共同学习Tableau初级图形绘制,期待你与我共同进步!!!

上一篇下一篇

猜你喜欢

热点阅读