R

统计数据可视化工具包:Seaborn

2021-02-13  本文已影响0人  LabVIEW_Python

什么是Seaborn?Seaborn是基于matplotlib的,面向统计数据可视化的,拥有更加好用易用的高抽象级别封装API的Python工具包。在做数据研究、分析和建模的时候,先把数据可视化,可以帮助你更好的探索和理解数据。

Seaborn接受的数据类型是:Pandas的dataframe和Numpy的array

Seaborn的显示函数分为三类: “relational”, “distributional”, and “categorical” Seaborn的显示函数

Seaborn最常用的函数是displot,即可视化数据分布方式,通过观察数据分布方式,可以了解到数据的主要趋势是什么?它们是否严重偏向一个方向?是否有双峰证据?有明显的离群值吗?先从一个最简单的范例说起

import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd

np.random.seed(0)
height = np.random.uniform(low=150, high=190, size=1000).reshape(-1, 1)
weight = np.random.normal(loc=70, scale=10, size=1000).reshape(-1, 1)
data = np.concatenate((height, weight), axis=1)
df = pd.DataFrame(data, columns=['height', 'weight'])

sns.set()  #切换到sns的默认运行配置,不切换图像就很丑
sns.displot(data=df)
plt.show()
全默认设置
sns.displot(data=df,kde=True)
plt.show()
kde=True
sns.displot(data=df, x='height', y ='weight',kind='kde')
查看两个变量之间的关系

Seaborn还有其它函数,参考上述方式,一边学习,一边测试即可。

上一篇下一篇

猜你喜欢

热点阅读