merge
2023-02-20 本文已影响0人
dittoyy3991
数据关联:pd.merge 和mysql的左右连接有点像
pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None,
left_index=False, right_index=False, sort=True,
suffixes=('_x', '_y'), copy=True, indicator=False,
validate=None)
参数理解:
- left 左表
- right 右表
- how 怎么连接的,左右内外?‘left’, ‘right’, ‘outer’, ‘inner’. 默认inner。inner是取交集INNER JOIN ,outer取并集FULL OUTER JOIN
- on 基于哪个字段连接的-没有匹配到的值会NaN
- left_on right_on左右名字不一样时用
- indicator=True 会告诉你是左边有还是右边有值
- sort=True 对链接的键值进行排序
数据拼接:pd.concat
concat 可以横向、纵向拼接,又起到关联的作用
concat 可以同时处理多个数据框DataFrame,而 merge 只能同时处理 2 个数据框
df.iterrows 可以返回所有的行索引,以及该行的所有内容
Python函数之iterrows, iteritems, itertuples对dataframe进行遍历
iterrows(): 将DataFrame迭代为(insex, Series)对。
iteritems(): 将DataFrame迭代为(列名, Series)对
itertuples(): 将DataFrame迭代为元祖。