pandas_1数据初描述、索引、切片

2019-02-28  本文已影响0人  幻想的双鱼座

1.数据读取

import pandas as pd

data = pd.read_csv("文件名")

2.数据初描述

data.info() ------ 描述每一列的非空数值个数以及数据类型 (Series无此参数)

data.describe() ------ 描述每一列数据的个数、最大、最小、平均值、方差等

data.head() ------ 列出头部前五行

data.columns ------ 数据的列名称

data.index ------- 数据的行名称

data.columns.tolist() -------将矩阵转换为列表形式

3.数据索引、切片

3.1 行索引 ----- loc 和 iloc

loc 轴标签索引

data.loc["行名称"](如果为数字,则没有引号)、data.loc[["行1",“行2”,,,,]](若为多列,需用中括号)

loc 轴标签切片

data.loc[["行1",“行2”,,,,],["列1",“列2”,,,,]],基本结构为data.loc[[行],[列]]

iloc 整数索引

data.iloc[1](索引第二行数据)、data.iloc[[1,2,3,4]]、data.iloc[:,:3]

iloc 整数切片同上

3.2 列索引

data["列名称"]、data[["列1",“列2”,,,,]]

补充:行选择语法

data[1:3]-----可直接取出1-2行的数据;

4. 数据选择

data[data["列x"] > N]------ 列x中大于N的所有数据

上一篇下一篇

猜你喜欢

热点阅读