利用Python进行数据分析(8) pandas基础: Seri

2016-08-07 本文已影响6313人杨存村長

一、reindex() 方法：重新索引

针对 Series 的重新索引操作

重新索引指的是根据index参数重新进行排序。
如果传入的索引值在数据里不存在，则不会报错，而是添加缺失值的新行。
不想用缺失值，可以用 fill_value 参数指定填充值。

fill_value 会让所有的缺失值都填充为同一个值，如果不想这样而是用相邻的元素（左或者右）的值填充，则可以用 method 参数，可选的参数值为 ffill 和 bfill，分别为用前值填充和用后值填充：

针对 DataFrame 的重新索引操作

二、drop() 方法：丢弃数据

针对 Series

针对 DataFrame

不仅可以删除行，还可以删除列：

三、索引、选取和过滤

针对 Series

需要注意一点的是，利用索引的切片运算与普通的 Python 切片运算不同，其末端是包含的，既包含最后一个的项。比较：

赋值操作：

针对 DataFrame

DataFrame 中的 ix 操作：

四、算术运算和数据对齐

针对 Series

将2个对象相加时，具有重叠索引的索引值会相加处理；不重叠的索引则取并集，值为 NA：

针对 DataFrame

对齐操作会同时发生在行和列上，把2个对象相加会得到一个新的对象，其索引为原来2个对象的索引的并集：

和Series 对象一样，不重叠的索引会取并集，值为 NA；如果不想这样，试试使用 add() 方法进行数据填充：

五、函数应用和映射

将一个 lambda 表达式应用到每列数据里：

除了lambda 表达式还可以定义一个函数：

六、排序

针对 Series

针对 DataFrame

七、排名

八、带有重复值的轴索引

索引不强制唯一，例如一个重复索引的 Series：

利用Python进行数据分析(8) pandas基础: Seri

一、reindex() 方法：重新索引

针对 Series 的重新索引操作

针对 DataFrame 的重新索引操作

二、drop() 方法：丢弃数据

针对 Series

针对 DataFrame

三、索引、选取和过滤

针对 Series

针对 DataFrame

四、算术运算和数据对齐

针对 Series

针对 DataFrame

五、函数应用和映射

六、排序

针对 Series

针对 DataFrame

七、排名

八、带有重复值的轴索引

猜你喜欢

热点阅读