pandas.DataFrame.hist函数bins参数的理解
2020-02-24 本文已影响0人
低碳环保_58a7
最近在学习机器学习,就顺道把自己的一些理解记下来。
解释
bins 参数的含义是所画出的直方图的“柱”的个数;每个“柱”的值为其跨越的值的个数和。
代码(in Jupyter notebook)
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
np.random.seed(42)
df = pd.DataFrame(data=np.random.randint(0, 8, size=(100,4)), columns=list('abcd'))
# print(df)
# print(df['a'].value_counts())
df.hist(bins=6, figsize=(20, 15))
plt.show()
hist函数bins参数说明
从图中可以看到‘柱’的个数为6,每个“柱”的值为其跨越的值的个数和。如第一个“柱”跨越了0和1,那么该柱的高度就是0和1出现的次数的总和。