【数据可视化】画个简单的箱形图
2019-08-20 本文已影响0人
清梦载星河
镇楼图(图片源自unsplash)
一、什么是箱型图
一个简单的箱形图箱型图大致样子如上图。
箱形图常使用于品质管理,主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。
在箱形图中主要有以下几个概念:
- Qi :i(n+1)/4
- Q1 : 下四分位数
- Q2 :中位数
- Q3 : 上四分位数
- IQR : Q3 - Q1
- 上限:Q3 + 1.5IQR
- 下限:Q1 - 1.5IQR
- 异常值:上限和下限之外的值
四、用matplotlib画箱型图
相关方法
- pandas.DataFrame.plot.box()(可自定义的功能更多)
- pandas.DataFrame.boxplot()
示例代码:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
df = pd.DataFrame(np.random.randint(100,1000,(10,10)),
columns=list('ABCDEFGHIJ'),index=list('abcdefghij'))
df.boxplot(figsize=(16,9))