python itertools.groupby

2018-05-31 本文已影响48人马小跳_

groupby(iterable[, keyfunc]) 
-> create an iterator which returns
    (key, sub-iterator) grouped by each value of key(value).

将key函数作用于序列的各个元素。根据key函数结果，将拥有相同函数结果的元素分到一个新的迭代器。每个新的迭代器以函数返回结果为标签。

注意：分组之前需要使用sorted()对原循环器的元素，根据key函数进行排序，让同组元素先在位置上靠拢。

示例：

from operator import itemgetter
from itertools import groupby

data = [
    {'name': 'zhangsan', 'age': 20, 'country': 'China'},
    {'name': 'lisi', 'age': 19, 'country': 'USA'},
    {'name': 'wangwu', 'age': 22, 'country': 'JP'},
    {'name': 'zhaoliu', 'age': 21, 'country': 'USA'},
    {'name': 'maqi', 'age': 22, 'country': 'USA'},
    {'name': 'yangba', 'age': 18, 'country': 'China'}
]


# 通过country进行分组
data.sort(key=itemgetter('country'))  # 需要先排序，然后才能groupby

lstg = groupby(data, itemgetter('country'))
for key, group in lstg:
    for g in group:  # group是一个迭代器，包含了所有的分组列表
        print(key, g)
        
"""
China {'country': 'China', 'age': 20, 'name': 'zhangsan'}
China {'country': 'China', 'age': 22, 'name': 'lijiu'}
JP {'country': 'JP', 'age': 22, 'name': 'lisi'}
USA {'country': 'USA', 'age': 19, 'name': 'wangwu'}
USA {'country': 'USA', 'age': 22, 'name': 'zhaoliu'}
USA {'country': 'USA', 'age': 22, 'name': 'pengqi'}
"""


# 返回每个分组的个数
res = dict([(key, len(list(group))) for key, group in lstg])

"""
{'JP': 1, 'China': 2, 'USA': 3}
"""

自定义分组

from itertools import groupby

lst = [2, 8, 11, 25, 43, 6, 9, 29, 51, 66]

def gb(num):
    if num <= 10:
        return 'less'
    elif num >= 30:
        return 'great'
    else:
        return 'middle'

print([(k, list(g)) for k, g in groupby(sorted(lst), key=gb)])

"""
[('less', [2, 6, 8, 9]), ('middle', [11, 25, 29]), ('great', [43, 51, 66])]
"""

python itertools.groupby

猜你喜欢

热点阅读