编程笔记5-pandas DataFrame和numpy arr

2022-05-28  本文已影响0人  江湾青年

pandas DataFrame

df.index
df.index.name
df.loc["某行行名"]
df["某列列名"]

取出的某行或某列为series数据结构,使用.values转化成array

df.drop(labels=0)                                # 删除第0行
df.drop(labels="toy",axis = 1)                   # 删除名称为“toy”的列
df.drop(labels="toy",axix = 1, inplace = True)   # 删除名称为“toy”的列,并修改原数据
df.dropna()                          # 删除至少有一个元素为nan的行
df.dropna(axis=1)                    # 删除至少有一个元素为nan的列
df.dropna(how='all')                 # 删除所有元素都为nan的行
df.dropna(thresh=2)                  # 删除至少有2个元素为nan的行
df.dropna(subset=['name', 'toy'])    # 删除'name', 'toy'列中有元素为nan的行

numpy array

np.isnan(array)         # 批量判别数组中每个元素是否为 nan
np.isinf(array)         # 批量判别数组中每个元素是否为 inf
np.isfinite(array)      # 批量判别数组中每个元素是否为非 inf 非 nan 的值
array.astype(int)
array.astype(str)
array.astype(float32)
np.delete(array,[0,2],axis = 1)    # 删除第0列和第2列
# 当axis = 0时删除的是行

参考

https://blog.csdn.net/domodo2012/article/details/112257148

上一篇下一篇

猜你喜欢

热点阅读