统计基础1-直方图
2019-12-25 本文已影响0人
百分号
测量A城市居住人群的身高.
我们手里已经有了A城市所有人身高测量值, 想要可视化看一下这些人的身高有什么特点.
从左至右画一条X坐标, 身高从小到大变化, X坐标的量纲是身高.
Figure1_一个人一个点 Figure2_两个人 Figure3_一群人当人的数量逐渐变多时, 有些点在X坐标轴上被覆盖了.为了使被覆盖的身高值也能在图中体现出来, 需要做两件事情.
- 将short->tall的所有值, 分成若干个bucket.
- 将每个bucket中的人纵向叠起来, 就像冰糖葫芦, 每个bucket的高度代表冰糖葫芦的个数.
瞧, 我们将A城市所有人的身高从低到高, 每一个人都在图中展示了出来. 这就是直方图的原理.
- 横坐标: 观测值, 如身高, 体重, 年龄, 数量, 分布占比等等
- 纵坐标: 观测样本数.
直方图
Figure5_某App登录时间在16-18点的人数占比import matplotlib.pyplot as plt
plt.hist(login_range1, bins=20)
Figure6_某App登录时间在10-14点的人数占比
import matplotlib.pyplot as plt
plt.hist(login_range2, bins=30)
从直方图上, 我们可以看出观测数据大概的分布, Figure6看上去服从正太分布, 而Figure2看上去服从指数分布.