IT专题推荐教育创业

数据可视化 | 你想知道的可视化图都在这

2017-02-25  本文已影响1506人  清听

对可视化的使用认知或许来源于下面这张图。虽然结构清晰,但它只针对Excel图表,不够丰富,本文会结合数据分析师的使用场景展示更多的可视化案例,用对图胜于用绚丽的图表。(图表均来自网络)

丰富的图表可以通过位置、长度、角度、方向、形状、面积、体积、饱和度、色调来产生视觉暗示,达到聚焦用户视线,表达图表所表达含义。

常用图表

Ⅰ、常用三大图:柱(条)、线、饼(环)

柱状图:柱形图是分析师最常用到的图表之一,常用于多个维度的比较和变化。文本维度/时间维度通常作为X轴。数值型维度作为Y轴。柱形图至少需要一个数值型维度。柱形图的对比分析,通过颜色区分类别。当需要对比的维度过多,柱形图是力不从心的。

基础柱状图:每个组数据建议只展示1~3列数据,太多会导致对比困难,图形烦乱;表现每条数据具体值,容易比较大小

柱状图

条形图:容易比较大小,更关注组内比较

条形图

含正负值的条形图:显示两个项目之间有没有相关关系

含正负值的条形图

堆积条形图(堆积柱状图):比较组内占比情况,同时可以比较各组每部分及整体大小

堆积条形图

瀑布图:各成分分布构成情况

瀑布图

折线图:折线图是观察数据的趋势,它和时间是好基友,当我们想要了解某一维度在时间上的规律或者趋势时,就用折线图吧。

基础折线图:每组数据建议最多不超过5个点;数据常表现趋势,波动

折线图

饼图(环图):饼图是有缺陷的,它擅长表达某一占比较大的类别。但是不擅长对比。30%和35%在饼图上凭肉眼是难以分辨出区别的。当类别过多,也不适宜在饼图上表达。

饼图:可展示多组数据;表现各组数据占总比情况。

基础饼图

双饼图:展示各组内分布情况

双饼图

Ⅱ、面积图、散点图(气泡图)、雷达图

面积图

面积图:通过面积展示数据值大小,形象直观

面积图

散点图:散点图在报表中不常用到,但是在数据分析中可以算出镜率最高的。散点图通过坐标轴,表示两个变量之间的关系。绘制它依赖大量数据点的分布。直观,尤其是大数据量,散点图会有更精准的结果。比如统计中的回归分析,比如数据挖掘中的聚类。

散点图:优势是揭示数据间的关系,发觉变量与变量之间的关联。

散点图

气泡图:在散点图的基础上加上面积标示大小,富裕散点图比较大小的功能;气泡图经常需要辅助线来获得图形结论

气泡图

雷达图:可能男同胞们在游戏中看到它比较多。它在商务、财务领域应用较大,适合用在固定的框架内表达某种已知的结果。常见于经营状况,财务健康程度。

雷达图:用来展示某一类型事物在几个属性的优良情况,或该类事物互相对比

雷达图

Ⅲ、地理图、热力图、矩形树图

地理图:一切和空间属性有关的分析都可以用到地理图。比如各地区销量,或者某商业区域店铺密集度等。

地理图:地理图的绘制离不开地图数据,POI是很重要的要素。POI是“Point of Information”的缩写,可以翻译成信息点,每个POI包含四方面信息,名称、类别、经度纬度、附近的酒店饭店商铺等信息。借助POI,才能按地理维度展现数据。

地理图

热力图:互联网产品中,热力图可以用于网站/APP的用户行为分析,将浏览、点击、访问页面的操作以高亮的可视化形式表现。

热力图:需要数据量较大,常出现在BI系统,很少通过数据分析师制作

热力图

矩形树图:柱形图不适合表达过多类目(比如上百)的数据,矩形树图的出现,直观地以面积表示数值,以颜色表示类目。

矩形树图:还可以在每个小面积增加数据点,来代表峰值,最大值。电子商务、产品销售等涉及大量品类的分析,都可以用到矩形树图

矩形树图

Ⅴ、桑基图、漏斗图、箱线图

桑基图:表示信息的变化和流动状态

桑基图:数据分析师经常接触到桑基图,只是不知道它的正式名字,它就是Google网站分析中的用户行为和流量分析。用户从哪里来,去了哪个页面,在哪个页面离开,最后停留在哪个页面,比例分析等

桑基图

漏斗图:转化率可视化,它适用在固定流程的转化分析,你也可以认为它是桑基图的简化版

漏斗图:转化率也可以用几组数字表示,不一定做成漏斗图,当然,为了显得自己更专业

漏斗图

箱线图:准确地反映数据维度的离散(最大数、最小数、中位数、四分数)情况。凡是离散的数据都适用箱线图。

箱线图:线的上下两端表示某组数据的最大值和最小值。箱的上下两端表示这组数据中排在前25%位置和75%位置的数值。箱中间的横线表示中位数。假如你是一位互联网电商分析师,你想知道某商品每天的卖出情况:该商品被用户最多购买了几个,大部分用户购买了几个,用户最少购买了几个。箱线图就能很清晰的表示出上面的几个指标以及变化

箱线图

Ⅵ、其他图形

词云

用来展示高频出现的词,搜索词等

关系图

展现事物相关性和关联性的图表,比如社交关系链、品牌传播、或者某种信息的流动

堆积玫瑰图

优点:可在一个图表中集中反映多个维度方面的百分比构成数据,幅面小,信息量大,形式新颖,吸引注意力,够高级,够给力:)

缺点:非常见图表形式,多数人不易看懂。图形存在误导因素,同样的半径长度,越往外面积越大,但实际是以长度代表数值。

适用场合:适合书面研读,不太适合PPT讲解。适合商业杂志、财经报刊等媒体做信息图表用途,传统工作场合需慎用,可能会给人用力过猛、炫技、夸张的感觉。

混合图

常见混合图为线柱混合图

上一篇下一篇

猜你喜欢

热点阅读