Pandas之cut函数完成数据分组
2021-11-28 本文已影响0人
测试探索
一、cut函数介绍
cut(Series,bins,right = True,labels = null )
Series:需要分组的数据【数据框的某列数据】
bins:分组的划分数组【列表】
right:分组的时候右边是否闭合,默认闭区间
labels:分组的自定义标签
实现步骤
1、数据准备
df = pd.read_excel("PycharmProjects/untitled/this/ant-learn-pandas/testforpandas/data1.xlsx",engine = "openpyxl")
print(df.head())
image.png
2、对人均GDP分组
bins = [min(df["人均GDP"]) - 1,2000,4000,6000,8000,max(df["人均GDP"]) + 1]
print(bins)
df["人均GDP分组"] = pd.cut(df.人均GDP,bins)
print(df)
image.png
3、自定义标签
#自定义标签
labels = ["2000一下","2001~4000","4001~6000","6001~8000","8000以上"]
df["人均GDP分组"] = pd.cut(df.人均GDP,bins,labels = labels)
print(df)
image.png