第一章:第二节pandas基础--6.16

2021-06-16  本文已影响0人  小憨豆

注:df = pd.read_csv('train.csv')

1. DataFrame和Series的异同点:

区别:

Series,只是一个一维数据结构,它由index和value组成。

DataFrame,是一个二维结构,除了拥有index和value之外,还拥有column。

联系:

DataFrame由多个Series组成,无论是行还是列,单独拆分出来都是一个Series。

2. 查看DataFrame每列的名称可以用:df.columns;若要转成列表的形式:df.columns.values.tolist()

3. 查看特定列的数据可以用如下代码表示:df['Cabin']或者df.Cabin或者df[['Cabin']]。不过df['Cabin']和df[['Cabin']]的区别在于:前者出来的是Series格式,而后者还是DataFrame格式。

4. 删除特定列可以用del语句或者drop语句。

5. 筛选条件可以用df[df['']<]等表示,注意对交并集的差别。

6. loc语句和iloc语句的区别:

引用格式发生变化,前者引用某列可以直接用列名查找,而后者可以用index进行查找。

第二处不同是iloc 主要定位的是相对位置;loc 定位的是DataFrame本身的index。

上一篇下一篇

猜你喜欢

热点阅读