python基础-13-数据分析python——pandas——
2019-03-29 本文已影响0人
比特跃动
本章内容包括: groupby的serives.avg和dataframe.loc
导入数据
//input1
import pandas as pd
position = pd.read_csv('DataAnalyst_utf.csv',encoding='utf')
position.groupby(by = ['city','education']).mean()
//output1
positionId bottom top avg city education
上海 不限 2.136313e+06 10.147059 17.955882 14.051471
博士 2.318894e+06 11.000000 19.000000 15.000000
大专 2.224099e+06 10.045455 16.745455 13.395455
本科 2.163757e+06 13.420168 22.686275 18.053221
硕士 2.123804e+06 13.767123 24.410959 19.089041
北京 不限 2.222436e+06 11.292683 19.983740 15.638211
博士 1.268134e+06 17.500000 32.500000 25.000000
大专 2.321920e+06 9.206349 15.539683 12.373016
本科 2.194100e+06 14.235546 24.657388 19.446467
硕士 2.193679e+06 14.500000 25.073333 19.786667
南京 不限 2.512235e+06 5.000000 9.000000 7.000000
大专 2.123662e+06 7.090909 11.454545 9.272727
本科 2.235469e+06 8.366667 14.500000 11.433333
硕士 2.481681e+06 9.500000 17.500000 13.500000
厦门 不限 1.773008e+06 8.333333 16.666667 12.500000
大专 2.048278e+06 4.714286 8.857143 6.785714
本科 1.902825e+06 8.444444 15.166667 11.805556
硕士 2.296814e+06 10.500000 21.000000 15.750000
天津 不限 2.378458e+06 3.000000 4.000000 3.500000
大专 2.517176e+06 4.250000 6.750000 5.500000
本科 2.132332e+06 7.066667 11.533333 9.300000
广州 不限 2.224884e+06 6.833333 11.666667 9.250000
大专 2.274389e+06 6.867470 11.228916 9.048193
本科 2.191311e+06 10.418103 17.922414 14.170259
硕士 2.374382e+06 10.714286 18.428571 14.571429
成都 不限 2.347340e+06 7.625000 13.500000 10.562500
大专 2.232275e+06 8.115385 13.884615 11.000000
本科 2.205122e+06 10.061856 17.288660 13.675258
硕士 1.869038e+06 9.500000 16.000000 12.750000
杭州 不限 2.256184e+06 13.000000 23.538462 18.269231
大专 2.259643e+06 8.862069 15.793103 12.327586
本科 2.178153e+06 12.142857 21.607973 16.875415
硕士 2.271047e+06 15.611111 25.888889 20.750000
武汉 不限 2.096199e+06 8.100000 13.800000 10.950000
大专 2.016487e+06 8.071429 14.357143 11.214286
本科 2.153728e+06 8.159091 14.840909 11.500000
硕士 2.551938e+06 6.000000 8.000000 7.000000
深圳 不限 2.172441e+06 11.450000 18.750000 15.100000
博士 1.259338e+06 30.000000 40.000000 35.000000
大专 2.216348e+06 10.563830 17.234043 13.898936
本科 2.119014e+06 13.261538 23.674359 18.467949
硕士 2.079558e+06 12.764706 23.294118 18.029412
苏州 大专 1.835047e+06 10.600000 18.600000 14.600000
本科 2.149926e+06 10.448276 18.172414 14.310345
硕士 2.569695e+06 12.000000 21.666667 16.833333
西安 不限 1.847092e+06 5.000000 9.000000 7.000000
大专 2.400272e+06 6.400000 9.900000 8.150000
本科 2.158057e+06 8.833333 15.583333 12.208333
硕士 2.445967e+06 4.000000 6.000000 5.000000
长沙 不限 2.317809e+06 6.285714 9.000000 7.642857
大专 2.069686e+06 6.000000 12.000000 9.000000
本科 2.046988e+06 7.466667 13.800000 10.633333
硕士 2.192339e+06 6.000000 12.000000 9.000000
//input2
position.groupby(by = ['city','education']).mean().loc['上海','博士']
//output2
positionId 2.318894e+06
bottom 1.100000e+01
top 1.900000e+01
avg 1.500000e+01
Name: (上海, 博士), dtype: float64
//input3
position.groupby(by = ['city','education']).mean().avg
//output3
city education
上海 不限 14.051471
博士 15.000000
大专 13.395455
本科 18.053221
硕士 19.089041
北京 不限 15.638211
博士 25.000000
大专 12.373016
本科 19.446467
硕士 19.786667
南京 不限 7.000000
大专 9.272727
本科 11.433333
硕士 13.500000
厦门 不限 12.500000
大专 6.785714
本科 11.805556
硕士 15.750000
天津 不限 3.500000
大专 5.500000
本科 9.300000
广州 不限 9.250000
大专 9.048193
本科 14.170259
硕士 14.571429
成都 不限 10.562500
大专 11.000000
本科 13.675258
硕士 12.750000
杭州 不限 18.269231
大专 12.327586
本科 16.875415
硕士 20.750000
武汉 不限 10.950000
大专 11.214286
本科 11.500000
硕士 7.000000
深圳 不限 15.100000
博士 35.000000
大专 13.898936
本科 18.467949
硕士 18.029412
苏州 大专 14.600000
本科 14.310345
硕士 16.833333
西安 不限 7.000000
大专 8.150000
本科 12.208333
硕士 5.000000
长沙 不限 7.642857
大专 9.000000
本科 10.633333
硕士 9.000000
Name: avg, dtype: float64
//input4
position.groupby(by = ['city','education']).mean().avg['上海']
//output4
education
不限 14.051471
博士 15.000000
大专 13.395455
本科 18.053221
硕士 19.089041
Name: avg, dtype: float64