遍历groupby对象:返回的一个是分组键的键名,一个是对应键名
2020-05-11 本文已影响0人
弦好想断
df = DataFrame({'key1':['a','a','b','b','a'],
'key2':['one','two','one','two','one'],
'data1':np.random.randn(5),
'data2':np.random.randn(5)})
df

通用的groupby方法是size,size方法返回一个包含组大小信息的Series:
df.groupby(['key1','key2']).size()
key1 key2
a one 2
two 1
b one 1
two 1
dtype: int64
遍历各分组
GroupBy对象支持迭代,会生成一个包含组名和数据块的2维元组序列。
for name,group in df.groupby('key1'):
print(name)
print(group)
