数据可视化

《数据可视化》 - 阅读索引

2018-07-07  本文已影响395人  TWLESVCNZ

基础篇

第一章 数据可视化简介

1.1 可视化释义

在计算机学科的分类中:利用人眼的感知能力对数据进行交互的可视表达以增强认知的技术,称为可视化。

它将不可见或难以直接显示的 数据转化为可感知的图形、符号、颜色、纹理等,增强数据识别效率,传递有效信息。

可视化是认知的过程,即形成某个问题的感知图像,强化认知理解。

可视化的终极目的是对事物规律的洞悉,而非所绘制的可视化结果本身。这包含多重含义:发现、决策、解释、分析、探索和学习。因此,可视化可简明地定义为“通过可视表达增强人们完成某些任务的效率”。

从宏观的角度看,可视化包括三个功能:

1.2 可视化简史

可视化发展史与测量、绘画、人类现代文明的启蒙和科技的发展一脉相承。

  1. 17 世纪之前:图表萌芽
  2. 1600 - 1699 年:物理测量
  3. 1700 - 1799 年:图形符号
  4. 1800 - 1900 年:数据图形
  5. 1900 - 1949 年:现代启蒙
  6. 1950 - 1974 年:多维信息的可视编码
  7. 1975 - 1987 年:多维统计图形
  8. 1987 - 2004 年:交互可视化
  9. 2004 年至今:可视分析学

1.3 数据可视化详解

1.3.1 数据科学的发展

数据科学的基本模型:数据 -> 信息 -> 知识 -> 智慧

1.3.2 数据可视化的意义

数据可视化的作用在于视物致知,即从看见物体到获取知识。

需要达到真、善、美的均衡:

1.3.3 数据可视化的分类

处理对象是数据。

1.3.4 数据可视化与其他学科领域的关系

1.4 数据可视化研究挑战

三方面约束:

两方面挑战:


第二章 视觉感知与认知

2.1 视觉感知和认知

用户是所有行为的主体:通过视觉感知器官获取可视信息、编码并形成认知,在交互分析过程中获取解决问题的方法。在这个过程中,感知和认知能力直接影响着信息的获取和处理进程,进而影响对外在世界环境所做出的反应。

人类处理数据的能力远远落后于获取数据的能力,人类视觉对于形象视觉符号的理解能力更强。

2.1.1 视觉感知和认知的定义

感知指客观事物通过感觉器官在人脑中的直接反映。

认知指在认识活动的过程中,个体对感觉信号接收、检测、转换、简约、合成、编码、储存、提取、重建、概念形成、判断和问题解决的信息加工处理过程。

2.1.2 视觉感知处理过程

人类感知系统由负责语言方面和其他非语言事物的两个子系统组成。

大脑对于视觉信息的记忆效果和记忆速度好于对语言的记忆效果和记忆速度。

视觉分为低阶视觉和高阶视觉。

2.1.3 格式塔理论

强调经验和行为的整体性,最基本的法则是简单精炼法则,认为人们在进行观察时,倾向于将视觉感知内容理解为常规的、简单的、相连的、对称的或有序的结构。同时,人们在获取视觉感知的时候,会倾向于将事物理解为一个整体,而不是组成该事物所有部分的集合。

可以看出,格式塔(完形理论)的基本思想是:视觉形象首先是作为统一的整体被认知的,而后才以部分的形式被认知。

2.2 颜色

颜色与形状和布局构成了最基本的数据编码手段。

2.2.1 颜色刺激理论
2.2.2 色彩空间

色彩空间是描述使用一组值表示颜色的方法的抽象数学模型。

2.3 视觉编码原则

可视化将数据以一定的变换和视觉编码原则映射为可视化视图。

2.3.1 相对判断和视觉假象

人类感知系统的工作原理决定于对所观察事物的相对判断。(参照物)

视觉假象指人们通过眼睛所获得的信息被大脑处理后形成的关于事物的感知,与事物在客观世界中的物理现实并不一致的现象。

可视化设计时要考虑到人类感知系统的这种现象,排除误导用户的可视化元素。

2.3.2 标记和视觉通道

可视化编码由两部分组成:

标记

视觉通道

2.3.3 视觉通道的概念

将数据信息以可视化视图进行呈现,其关键步骤是对数据信息进行编码,即将数据属性以标记呈现后,通过视觉通道控制标记的呈现方式。

视觉通道的类型

视觉通道的表现力和有效性

表现力判断标准

2.3.4 视觉通道的特性

不同的视觉通道,被用户的感知与认知系统处理并获取的信息不同

平面位置

颜色

尺寸

斜度和角度

形状

纹理

动画


第三章 数据

3.1 数据释义

3.1.1 数据基础

数据分类

数据集

数据相似度与密度

3.1.2 数据科学及过程

3.2 数据获取和预处理

3.2.1 数据获取
3.2.2 数据预处理

3.3 数据组织与管理

数据管理包括对数据进行有效的收集、存储、处理和应用的过程。

数据组织的层次体系:位、字符、数据元、记录、文件、数据库

与数据可视化有关的常用数据组织和管理形式:

3.3.1 数据清洗和精简

解决以下这些数据质量问题的方法称为数据清洗:

数据精简

3.3.2 数据整合和集成

数据整合指将不同数据源的数据进行采集、清洗、精简和转化后统一融合在一个数据集中,并提供统一数据视图的数据集成方式

数据集成指数据库应用中结合不同资源的数据并提供数据集合的统一访问

3.3.3 数据库
3.3.4 数据仓库

3.4 数据分析与挖掘

3.4.1 探索式数据分析
3.4.2 联机分析处理
3.4.3 数据挖掘

3.5 数据工作流

3.6 数据科学的挑战


第四章 数据可视化基础

4.1 数据可视化基本框架

数据可视化的基本流程和可视化设计的多层次模型。

4.1.1 数据可视化流程
4.1.2 数据可视化设计

数据可视化设计的四个级联的层次:

4.2 可视化中的数据

为了提高可视表达的准确性,需要研究数据的分类及其对应的可视化编码方法

4.2.1 数据认知

对数据的认知从数据模型到概念模型

4.2.2 数据类型

4.3 可视化的基本图表

按照所呈现的信息和视觉复杂程度分为三类:原始数据绘图、简单统计值标绘、多视图协调关联

4.3.1 原始数据绘图

可视化原始数据的属性值,直接呈现数据特征

数据轨迹

柱状图

直方图

饼图

等值线图

走势图

散点图和散点图矩阵

维恩图

热力图

4.3.2 简单统计值标绘
4.3.3 多视图协调关联

4.4 可视化设计原则

设计制作可视化图表三个主要步骤:

  1. 确定数据到图形元素(标记)和视觉通道的映射
  2. 视图的选择与用户交互控制的设计
  3. 数据的筛选,即确定在有限的可视化视图空间中选择适当容量的信息进行编码
4.4.1 数据到可视化的直观映射
4.4.2 视图选择与交互设计
4.4.3 信息密度——数据的筛选
4.4.4 美学因素
4.4.5 动画与过渡
4.4.6 可视化隐喻
4.4.7 颜色与透明度

4.5 可视化理论发展

4.5.1 图形符号学
4.5.2 关系数据的图形表示
4.5.3 图形语法
4.5.4 基于数据类型的研究
4.5.5 基于数据状态模型的研究
4.5.6 多维关系数据库可视化分析系统

时空数据篇


非时空数据篇


用户篇

上一篇下一篇

猜你喜欢

热点阅读