seaborn常见绘图学习总结(分布图)

2020-04-30  本文已影响0人  Rambogoal

在做数据分析之前,有时需要对数据进行可视化,从宏观上对数据的分布有一个认识,进而更好的理解数据在实际项目中的意义。

Seaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn就能做出很具有吸引力的图,而使用matplotlib能制作具有更多特色的图。应该把Seaborn视为matplotlib的补充,而不是替代物。

一、目录:

分布图

分类图

回归图

矩阵图

seaborn可以画的图形很多,不仅仅限于上面的几种图,详见官方文档:http://seaborn.pydata.org/index.html

总结的图形来源于官方文档、自己的相关数据可视化项目中

二、分布图:

2.1:displot(直方图)

直方图,是一种表示数据变化情况的图形。可以比较直观的看出数据的特性分布,对数据的分布状况有个宏观认识。具体参数如下:

 seaborn.distplot(a, bins=None, hist=True, kde=True, rug=False, fit=None, 
hist_kws=None, kde_kws=None, rug_kws=None, fit_kws=None, color=None,
 vertical=False, norm_hist=False, axlabel=None, label=None, ax=None) 

2.2、kdeplot(概率密度图)

概率密度图可以比较直观的看出数据样本本身的分布特征(作用效果与直方图中的kde效果类似),具体参数如下:

seaborn.kdeplot(data, data2=None, shade=False, vertical=False, kernel='gau', 
bw='scott', gridsize=100, cut=3, clip=None, legend=True, cumulative=False, 
shade_lowest=True, cbar=False, cbar_ax=None, cbar_kws=None, ax=None, **kwargs)

双变量密度图:


2.3、jointplot(联合密度图)

联合分布全称是联合概率分布,是两个及以上随机变量组成的随机变量的概率分布。即两个变量之间的联系与各个方向上的分布。具体参数如下:

seaborn.jointplot(x, y, data=None, kind='scatter', stat_func=None, color=None, 
height=6, ratio=5, space=0.2, dropna=True, xlim=None, ylim=None, joint_kws=None,
 marginal_kws=None, annot_kws=None, **kwargs)
默认情况 kind为“reg” kind为“kde”

2.4、pairplot(变量关系组图)

绘制给定数据集中,默认数据之间两两关系的图。该函数将创建一个轴网络,这样数据中的每个变量都讲通过跨一行的y轴和跨单个列的x轴共享。而对角线中则为该列变量的单变量分布。具体参数如下:

seaborn.pairplot(data, hue=None, hue_order=None, palette=None, vars=None, 
x_vars=None, y_vars=None, kind='scatter', diag_kind='auto', markers=None,
 height=2.5, aspect=1, dropna=True, plot_kws=None, diag_kws=None, 
 grid_kws=None, size=None)

默认情况 按照hue分类
上一篇 下一篇

猜你喜欢

热点阅读