计算机网络学习

python 分布分析

2017-08-28  本文已影响16人  正在充电Loading

import numpy

import pandas

data = pandas.read_csv(

'D:\\PDA\\5.3\\data.csv'

)

aggResult = data.groupby(

by=['年龄']

)['年龄'].agg({

'人数': numpy.size

})

data.年龄.hist()

bins = [

min(data.年龄)-1, 20, 30, 40, max(data.年龄)+1

]

labels = [

'20岁以及以下', '21岁到30岁', '31岁到40岁', '41岁以上'

]

data['年龄分层'] = pandas.cut(

data.年龄,

bins,

labels=labels

)

pAggResult = round(

aggResult/aggResult.sum(),

2

)*100

pAggResult['人数'].map('{:,.2f}%'.format)

上一篇下一篇

猜你喜欢

热点阅读