测试

pandas

2022-10-30  本文已影响0人  七七总是很暴躁
  1. dataframe取差集:A-B
    先把B表append到A,再用去重函数删除(选择不保留模式),得到的结果就是两表的差集A-B:
    dfC=dfA.append(dfB).drop_duplicates(keep=False)
  2. df拼接:
    pd.cnocat([df1,df2],axis=0),0-从下方纵向增加记录;1-从右侧增加字段
  3. datacompy的abs_tol和rel_tol
    datacompy.Compare(..., ans_tol=0.5)表示abs(a-b)小于0.5;
    datacompy.Compare(..., rel_tol=1e-10)表示abs(a / b - 1)小于10^-10
  4. groupby
    df2 = df1.groupby(key, as_index=False).agg({'test1':'sum'})
    sum为计算方式,可以为sum可以为mean;
    数据列内如果存在不同类型数据无法sum,该列会被丢弃,因此groupby之前最好fillna
上一篇下一篇

猜你喜欢

热点阅读