我爱编程

pandas 祛重

2017-10-25  本文已影响31人  大诗兄_zl

去重复

df.drop_duplicates(['FLAG'])

loandata.drop_duplicates()

pd.merge(nn.to_frame(),mm.to_frame(),left_on='月份',right_on='FLAG')

默认索引合并

dd=pd.merge(b,a,left_on='FLAG',right_on='月份',left_index=True,right_index=True )

pandas DataFram 如何制定列的顺序(默认列名字典顺序)

问题:默认的是按照列名的字典顺序排序的,要固定顺序,按照自己想要的顺序。

解决方案:

加columns字段即可

例子:

columns = ['cmt','class_label','test_label','predict_label']

df.to_csv("cnn_predict_result.csv",encoding="utf_8_sig",index=False,columns=columns)

df.replace  series值替换  

ser.replace(1, 11)

可以使用字典映射:将1替换为11,将2替换为12

ser.replace({1:11, 2:12})

df.fillna  使用0替代缺失值(当然你可以用任意一个数字代替NaN)

上一篇下一篇

猜你喜欢

热点阅读