python 中groupby高频应用

2021-10-28  本文已影响0人  我就是鱼鱼鱼

1、主要作用

这个和excel中分类汇总或者透视表实现的功能是一样的,比如有一组关于客户的数据,里面有客户的性别、年龄段等数据,现在想要知道每个年龄段每个性别有多少人。

2、常见应用1:单类分组

单类分组是指只有一个统计变量,如下面的统计字段['shot_zone_basic'] (数据是来自kaggle比赛数据)

创建groupby对象

以上的操作只能创建一个groupby对象,一般在应用中会加上要统计的方式,如下客户直接展示数据的多种统计指标,当然如果只需要统计一种统计指标可以直接将descrbe()替换成mean()、count()等。

按组统计相关统计指标

很多时候统计的指标和数据变量较多时,数据使用横排展示在视觉上很难看清,这时可以使用unstack()函数优化展示。

unstack()可以理解为将原来横排变成竖排数据展示更好

3、常见应用2:多类分组

多类统计是统计时有一个以上的变量,在实际工作中应用就是多个变量多个统计指标的统计方式,如下:

多类统计 多类多方式统计

4、groupby中匿名函数的应用

这种应用场景主要是针对在统计数据中某个字段时,仅统计字段中某一部分的内容,这个时候需要对字段进行自定义处理,如下:

groupby中使用匿名函数整理统计数据
上一篇 下一篇

猜你喜欢

热点阅读