数据可视化之美

Seaborn - 绘制热度图

2021-11-19  本文已影响0人  山药鱼儿

进行数据分析时,对数据的可视化展示可以更直观的展现数据的关系。热度图使用颜色直观地反应二维空间数值大小的分布。

开始今天的任务前,我们先来导入工具包,并执行魔法指令:

import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

%matplotlib inline
np.random.seed(0)

下面,随机构造一个 DataFrame ,并制定列名和索引:

data = pd.DataFrame(
    data=np.random.rand(3,3), 
    columns=['a1','a2','a3'], 
    index=['b1','b2','b3']
)
data

接下里,我们将该二维表以热度图的形式呈现出来:

heatmap = sns.heatmap(data)

绘制结果:

从该热度图中,我们可以直观地看出表格中的哪些位置数值分布大,哪些位置的数值较小,以及呈现出怎样的变化规律。当然,这里的数据是小鱼随意构造的,后面我们会看一个有规律可循的数据集热图。

在绘制热度图时,可以设置 vminvmax ,这样小于 vmin 的数值都将使用同一种颜色绘制,大于 vmax 的数值也将使用同一种颜色。

sns.heatmap(data, vmin=0.3, vmax=0.6)

绘制结果:

当然,也可以指定中间的值 center

sns.heatmap(data, center=0.5)

绘制结果:

下面,我们来看一份航班旅客数量的信息表:

flights = sns.load_dataset("flights")
flights.head()

数据如下:

我们将该 DataFrame 制作成数据透视表:

flights = flights.pivot(columns="year", index="month", values="passengers")
flights

数据透视表以 year 列为列索引,以 month 列为行索引,passengers 为值。

下面,使用热度图绘制出该数据透视表:

sns.heatmap(flights)

绘制结果:

我们可以清晰地发现,从 1949 年至 1960 年旅客数量总体在不断增加,其中每年的 6 月至 8 月为旅客数量最集中的时间段。

还可以在热度图中绘出具体的值:

sns.heatmap(flights, annot=True, fmt="d")

fmt 表示数字的显示格式,默认为科学计数法:

下面的画法也很不错,就是在绘制时把每个小格子的边框画出来:

sns.heatmap(flights, linewidths=0.5)

绘制结果:

为热度图自定义 color bar 调色板时,使用参数 cmap 指定即可:

sns.heatmap(flights, cmap="YlGnBu")
sns.heatmap(flights, cmap="BuPu_r")

这里讲个小技巧,如何看 cmap 有哪些字符串值选项呢?故意输一个不存在的颜色,报错提示就会告诉我们啦:

ValueError: 'RdGnBu' is not a valid value for name; supported values are 'Accent', 'Accent_r', 'Blues', 'Blues_r', 'BrBG', 'BrBG_r', 'BuGn', 'BuGn_r', 'BuPu', 'BuPu_r', 'CMRmap', 'CMRmap_r', 'Dark2', 'Dark2_r', 'GnBu', 'GnBu_r', 'Greens', 'Greens_r', 'Greys', 'Greys_r', 'OrRd', 'OrRd_r', 'Oranges', 'Oranges_r', 'PRGn', 'PRGn_r', 'Paired', 'Paired_r', 'Pastel1', 'Pastel1_r', 'Pastel2', 'Pastel2_r', 'PiYG', 'PiYG_r', 'PuBu', 'PuBuGn', 'PuBuGn_r', 'PuBu_r', 'PuOr', 'PuOr_r', 'PuRd', 'PuRd_r', 'Purples', 'Purples_r', 'RdBu', 'RdBu_r', 'RdGy', 'RdGy_r', 'RdPu', 'RdPu_r', 'RdYlBu', 'RdYlBu_r', 'RdYlGn', 'RdYlGn_r', 'Reds', 'Reds_r', 'Set1', 'Set1_r', 'Set2', 'Set2_r', 'Set3', 'Set3_r', 'Spectral', 'Spectral_r', 'Wistia', 'Wistia_r', 'YlGn', 'YlGnBu', 'YlGnBu_r', 'YlGn_r', 'YlOrBr', 'YlOrBr_r', 'YlOrRd', 'YlOrRd_r', 'afmhot', 'afmhot_r', 'autumn', 'autumn_r', 'binary', 'binary_r', 'bone', 'bone_r', 'brg', 'brg_r', 'bwr', 'bwr_r', 'cividis', 'cividis_r', 'cool', 'cool_r', 'coolwarm', 'coolwarm_r', 'copper', 'copper_r', 'crest', 'crest_r', 'cubehelix', 'cubehelix_r', 'flag', 'flag_r', 'flare', 'flare_r', 'gist_earth', 'gist_earth_r', 'gist_gray', 'gist_gray_r', 'gist_heat', 'gist_heat_r', 'gist_ncar', 'gist_ncar_r', 'gist_rainbow', 'gist_rainbow_r', 'gist_stern', 'gist_stern_r', 'gist_yarg', 'gist_yarg_r', 'gnuplot', 'gnuplot2', 'gnuplot2_r', 'gnuplot_r', 'gray', 'gray_r', 'hot', 'hot_r', 'hsv', 'hsv_r', 'icefire', 'icefire_r', 'inferno', 'inferno_r', 'jet', 'jet_r', 'magma', 'magma_r', 'mako', 'mako_r', 'nipy_spectral', 'nipy_spectral_r', 'ocean', 'ocean_r', 'pink', 'pink_r', 'plasma', 'plasma_r', 'prism', 'prism_r', 'rainbow', 'rainbow_r', 'rocket', 'rocket_r', 'seismic', 'seismic_r', 'spring', 'spring_r', 'summer', 'summer_r', 'tab10', 'tab10_r', 'tab20', 'tab20_r', 'tab20b', 'tab20b_r', 'tab20c', 'tab20c_r', 'terrain', 'terrain_r', 'turbo', 'turbo_r', 'twilight', 'twilight_r', 'twilight_shifted', 'twilight_shifted_r', 'viridis', 'viridis_r', 'vlag', 'vlag_r', 'winter', 'winter_r'

最后,如果你不想展示 Color Bar 也可以选择将其隐藏:

sns.heatmap(flights, cbar=False)
上一篇 下一篇

猜你喜欢

热点阅读