python操作Excel数据小记
2018-04-24 本文已影响0人
大唐跋锋寒
首先数据的运算肯定是在Dataframe中,所以一般数据处理中用到的其实就是excel数据的读取和写入。
看了一些文章,好像不需要,直接用pandas就可以了
一般来说,操作excel数据也就是筛选,排序,聚合,计数,不同表之间连接
在pandas中
筛选很简单
data=data[data[column]==条件],要注意就是代码中的等于号(==)
排序
Dataframe.sort_values([column],ascending=False)
计数
找个半天,loc比较厉害
count=data3[user_id].value_counts()
for i in data3["user_id"]:
data3.loc[data3["user_id"]==i,"counts"]=count[i]
这样就能给dataframe添加一列对userid的计数项