你想学数据可视化?都在这里了
作为大数据分析的最后一环,最后结果的解读、可视化,往往比前边的所有都重要。因为这直接决定了你分析的结果是否可以落地,是否可以实现价值。 -----某某
可视化,作为利用数据、信息用来达到自己目的、解决问题的最后一环,在很多时候往往重要性超过前边所有。在经过了定义问题、收集数据、数据清洗、数据建模、评价的环节以后,终于到了要将数据分析的结果展示出来的时候。
(一个普通企业中数据分析的流程)
不管是给领导的工作汇报、项目总结,给大众的科普,还是其他,都是需要把想要表达的信息、数据展现数来。而可视化,就是展示的艺术。
尤其是在一个并不是“数据驱动”的企业,也就是99.9%的企业中,数据分析相关环节的重要性其实是这样的。所以,对数据分析的解读以及可视化数据分析的结果,往往是比数据分析的过程重要的多
按照重要性来划分面积
从几年前第一次感受到“好看的图”和“不好看的图”之间的差距,就开始了解“可视化”这门混合了多个学科的艺术。
最近整理了之前的资料,又重新收集了一点新的材料,找到了现在最多人推荐,最好的可视化参考书。
分别是这几本(文后有下载)
The Visual Display of Quantitative Information, Edward Turfte
最简单的图形与最复杂的信息
数据可视化之美,Beauty Visualization,Juliesteele
鲜活的数据:数据可视化指南,Nanthan Yau
数据之美,Data Points: Visualization that means something,Nanthan
Yau
数据可视化,陈为
太多,怎么看?
在开始很长的一本一本介绍之前,先说最重要的部分,推荐学习过程:
完全不了解可视化,对于数据可视化没有经验:先推荐读从《最简单的图形与最复杂的信息》,再读《鲜活的数据》,用《数据可视化之美》当作课外书
对可视化有兴趣,有过简单数据分析、做报表等的可视化初级学者:推荐读《鲜活的数据》以及《数据之美》;喜欢练练英语的把《The Visual Display of Quantitative Information》作为课外书,如果不喜欢的就看看《数据可视化之美》
可视化有经验,对于数据分析、可视化基本原理有过系统性了解,也肯定有过一定学习,建议直接上手陈为的《数据可视化》;数据可视化之美,以及《The Visual Display of Quantitative Information》作为课外书,其他也可以顺便了解。
下面环节是:为什么?
1.《The Visual Display of Quantitative Information, Edward Turfte》
作者是大名鼎鼎的Edward Tufte,美国耶鲁大学统计学家,计算机、统计、政治的退休教授。因为作为在数据可视化方面的先驱而出名。他可以算是可视化研究的鼻祖了,这本书也是可视化的经典。在两年之前读了原本,书皮和这个一样。
书中讲了可视化的基本原理,讲到了一些复杂信息可视化的例子。比如非常经典的
还提到一些可视化信息的方式。主要都是非常基本的可视化原理,相比其他非常系统的书,这本“古董书”并不完全适合作为一个教程,适合英语较好,对可视化有兴趣的读者。有能力阅读英文书的读者,阅读时间大概在5-15小时。
2. 最简单的图形与最复杂的信息
看两个图大概就知道这本书的内涵了。
是的,这本书主要的内容,就是各类图形的特点、用途以及一些注意事项。在什么时候该使用什么样的图,在使用这种类型的图的时候,又要注意些什么才能达到更好的效果。
非常适合刚开始学习如何把报表、数据展示做好的新人。
书的内容很少也很容易理解,推荐阅读时间在1.5-4小时。
3. 数据可视化之美,Beauty Visualization
这本书首先读了英文版,然后正好又看到中文版,发现确实和很多人吐槽的一样,翻译比较差。所以喜欢顺便练练英语的同学可以尝试读一下英文版。
这本书的每一章都是由不同的人完成,每一章都介绍了一种可视化。很多都是从可视化的点子开始一直到如何实现,甚至包括一些以前的代码。比如“词云”发明者的那篇文章。
整体来讲这本书的内容更偏向“信息可视化”而不是“数据可视化”。先简单说一下个人非常不成熟的理解:
信息可视化更强调将现在有的信息,或者从数据中挖掘出来后的信息,进行展示。如何来让表达的信息更清楚、更美观、更好用,更吸引人。比如这样的地铁图,就是用来表现地铁的信息。
数据可视化更强调将数据,清楚的表达出来,让看到可视化的人,可以从数据中获取信息(而不是直接单纯表达信息),很多数据可视化也要强调交互的作用。数据可视化要求精确、很多时候作为进一步挖掘信息的辅助。
信息可视化很多的时候作为一次性的工作,比如绘制一个地铁图,关系图,人体神经图,战斗过程图,复杂关系图。而数据可视化在很多的时候都是重复使用的,数据改变,可视化改变,类似于各种各样的dashboard。
这本书集合了众多大师们的作品,非常值得一读,但是并不能作为系统的“数据可视化”的指导。非常推荐想要把数据、信息表达的好看的人来读一下,作为启发。但是并不能作为一个如何制造报表的参考。
4. 鲜活的数据:数据可视化指南,Nanthan Yau
这本书对于数据分析可视化的初学者首先是非常完整,有多完整呢,看下图:
首先用一章介绍了数据可视化的流程、目的,也就是“数据是用来讲故事”。数据是用来讲事实,说明问题的,为了数据分析而分析,为了可视化而可视化是没有意义。
这本书还介绍了不同的数据可视化工具,有非常多的例子和参考代码,内容非常丰富。书中的可视化大部分采用了“使用可视化工具(各种语言)出图,再使用Illustrator完善图表“的过程。非常值得参考,但是从目前(2018年中),以及个人经验(有过使用Tableau等专业可视化工具,熟练PPT经验)的角度来讲,没有学习的必要。
整体来讲整本书对于新手、可视化熟手都有看和学习的价值。很多部分值得自己试试实现,但是没有必要参考书中的具体实现方法,思想是类似的,具体可以自由发挥。
5. 数据之美,Data Points: Visualization that means something,Nanthan Yau
中文封面是这样的
这本书内容丰富,英文版目前还没有读完。从最基本的对于数据的理解开始,一直到可视化的基本元素、方式,各种类型的可视化。
使用了非常非常多很好的例子来讲述这些内容。整体上来说可以看成是上一本书的一个升级和加强版本。非常推荐对于想要利用数据来讲故事、说明问题,利用数据工作的人读读。
一部分目录以及示例图:
6. 《数据可视化》,陈为
作为一本六百多页的书,这本书可以说是把可视化从出生到现在都讲了,涵盖了非常广的内容。从可视化的最初意义,人的视觉感受,色彩原理,一直到可视化技术的具体细节实现。
我们看一下前两章的目录感受一下:
可以说这本书是唯一一本只是看了目录就觉得“好厉害”的可视化相关书了。
讲了可视化的发展,又讲了颜色、视觉原理,让我想起来当时在德国上的一门关于视觉和媒体的课。
书中把数据可视化这样一个大概念,按照应用分为三类:
科学可视化:最早,最成熟的领域,主要是自然科学各个学科对于数据和模型进行解释,处理。早期主要关注于三维数据的可视化。
信息可视化:对象一般是抽象的、非结构的数据集合。更关注抽象高维数据,根据具体信息决定不同形式,大概有时空数据,层次与结构数据,文本和跨媒体,多变量数据等
可视分析学:以可视交互为基础的分析推理科学,综合了图形学、数据挖掘和人机交互。把人的认知融入数据处理过程中,完成分析推理和决策。
一般我们认识的数据可视化等,大多数都属于信息可视化范畴之内。
在讲完可视化的历史,数据和可视化的基础以后,后边的内容分成“时空数据”和“非时空数据”两大块。
内容中很大一部分,也是可视化技术的背后实现。
这是唯一的一本还没有正式开始读的书,不做过多评价,整体来说,非常推荐对于可视化真的有兴趣,想要系统学习可视化的各位来读。
——————
想要书的,关注下方后,回复 “可视化书” 获得下载链接
——————
制造业从业,或者对数据在制造业应用感兴趣的,共同交流学习的可以加