pandas
2022-10-30 本文已影响0人
七七总是很暴躁
- dataframe取差集:A-B
先把B表append到A,再用去重函数删除(选择不保留模式),得到的结果就是两表的差集A-B:
dfC=dfA.append(dfB).drop_duplicates(keep=False) - df拼接:
pd.cnocat([df1,df2],axis=0),0-从下方纵向增加记录;1-从右侧增加字段 - datacompy的abs_tol和rel_tol
datacompy.Compare(..., ans_tol=0.5)表示abs(a-b)小于0.5;
datacompy.Compare(..., rel_tol=1e-10)表示abs(a / b - 1)小于10^-10 - groupby
df2 = df1.groupby(key, as_index=False).agg({'test1':'sum'})
sum为计算方式,可以为sum可以为mean;
数据列内如果存在不同类型数据无法sum,该列会被丢弃,因此groupby之前最好fillna