数据可视化

2020-04-16  本文已影响0人  阿猫阿狗Hakuna

总结自《极客时间——数据分析课程》

数据可视化分为以下9种情况:


image.png

一.可视化工具

1.商业智能分析

Tableau、PowerBI、FineBI

2.可视化大屏

DataV、FineReport

3.前端可视化组件

Web渲染技术:Canvas、SVG是html5中主要的2D图形技术,WebGL是3D框架。
可视化组件:Echarts、D3、Three.js、AntV

4.编程语言

Python:matplotlib、Seaborn。

二.Python可视化技术

使用python进行数据分析,需要在开始时进行探索性的数据分析,了解数据。

1.可视化试图的种类

比较:比较数据间各类别的关系,或者是它们随着时间的变化趋势,比如折线图。
联系:查看两个或两个以上变量之间的关系,比如散点图。
构成:每个部分占整体的百分比,或者是随着时间的百分比变化,比如饼图。
分布:关注单个变量,或者多个变量的分布情况,比如直方图。

按照变量的个数,我们可以把可视化视图划分为单变量分析和多变量分析。

(1)散点图
image.png

散点图的英文叫做 scatter plot,它将两个变量的值显示在二维坐标中,非常适合展示两个变量之间的关系。
画散点图,需要使用 plt.scatter(x, y, marker=None) 函数。x、y 是坐
标,marker 代表了标记的符号。比如“x”、“>”或者“o”。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

N = 1000
x = np.random.randn(N)
y = np.random.randn(N)
plt.scatter(x, y, marker='x')
plt.show()
(2)折线图

折线图可以用来表示数据随着时间变化的趋势。
Matplotlib 中,我们可以直接使用 plt.plot() 函数,当然需要提前把数据按照 x 轴的大小进行排序,要不画出来的折线图就无法按照 x 轴递增的顺序展示。

import matplotlib.pyplot as plt

x = [2010, 2011, 2012, 2013, 2014, 2015, 2016]
y = [5, 3, 6, 20, 17, 16, 19]
plt.plot(x, y)
plt.show()
(3)直方图

在 Matplotlib 中,我们使用 plt.hist(x, bins=10) 函数,其中参数 x 是一维数组,bins 代表直方图中的箱子数量,默认是 10。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

a = np.random.randn(100)
s = pd.Series(a)
plt.hist(s)
plt.show()
上一篇 下一篇

猜你喜欢

热点阅读