js css html

Python pandas 对单列多列进行操作

2022-10-25  本文已影响0人  王叽叽的小心情

其实之前都写过小笔记了Python Pandas 中lambda和apply函数的应用。用到的方法还是针对dataframe的apply函数+lambda表达式,除此之外,还存在针对series的map函数和apply函数。

下面区分单列、多列和元素级别的的操作。

1. 对单列进行操作,Series.apply()函数和Series.map()函数

针对一个Series,map函数和apply函数均可操作,看官方文档的介绍,apply适用于更复杂的操作功能。

s = pd.Series(['cat', 'dog', np.nan, 'rabbit'])

>>> s.map('I am a {}'.format, na_action='ignore')
0     I am a cat
1     I am a dog
2            NaN
3  I am a rabbit
dtype: object
df['new_col'] = df['col'].apply(lambda x: x+2)
2. 对多列进行操作,DataFrame.apply()函数

apply函数是针对指定的轴进行操作的,所以其实是行列都可以操作的,对列进行操作时指定axis=1,如下所示

df['new_col'] =  df.apply(lambda x: x['a'] + x['b'] - x['c'], axis=1)
def self_sum(a, b):
   return a ^ 2 + b ^ 2

df['sum'] = df.apply(lambda x: self_sum(x['from'], x['to']), axis=1)
3. 对个体元素进行操作,DataFrame.applymap()函数

针对整个dataframe,比如获取每个元素的长度

df.applymap(lambda x: len(str(x)), na_action='ignore')

针对整个dataframe的操作可以直接操作的,比如df**2就是对每个元素进行平方,效率更高。

今天动手归一化pandas中dataframe的一个列,竟然还忘记加apply了,哎,基础功一点都不扎实呀

上一篇 下一篇

猜你喜欢

热点阅读