Python数据分析与机器学习笔记Pandas

python数据分析处理库-Pandas

2019-01-15  本文已影响6人  python机器学习学习笔记

import pandas as pd # 导入pandas库,并重命名为pd

a = pd.read_csv("1.csv") # 读取csv文件

print(type(a)) # 打印a的类型

print(a.dtypes) # 打印csv文件里各字段类型

print("-----------------------------------")

print(a.head()) # 默认显示csv文件里前五条数据

print(a.head(3)) # 3表示显示csv里前三条数据

print(a.tail()) # 默认显示csv文件里后五条数据

print(a.tail(3)) # 3表示显示csv里后三条数据

print("-----------------------------------")

print(a.columns) # 打印csv文件里的列名

print(a.shape) # 打印csv文件行数,列数

print("-----------------------------------")

print(a.loc[0]) # 获取csv文件里第一行数据

print(a.loc[6]) # 获取csv文件里第七行数据 ,[]里的数字代表索引值

print(a.loc[0:2]) # 获取csv文件里第一,二,三行数据

print("--------------获取列名以len结尾的数据---------------------")

column_names = a.columns.tolist() # 获取列名

gram_columns = [] # 用来存放以len结尾的列名

for c in column_names: # 循环遍历列名

    if c.endswith("len"): # 判断是否是以len结尾的列

        gram_columns.append(c) # 是就加入数组里

new_column = a[gram_columns] # 所有列名以len结尾的数据

print(new_column.head(3)) # 打印前三行

print("-----------------------------------")

sepal_new = a["sepal_len"] * a["sepal_width"] # 对文件的数据进行乘法计算

print(sepal_new[0:3]) # 打印前三行

a["sepal_new"] = sepal_new # 创建一个新的列,并赋值

print(a.head(3))

print("-----------------------------------")

a.sort_values("sepal_new", inplace=True) # 对sepal_new进行排序,默认为升序,inplace在原来基础上进行修改

print(a["sepal_new"][0:3])

a.sort_values("sepal_new", inplace=True, ascending=False) # 降序

print(a["sepal_new"][0:3])

print("-----------------------------------")

上一篇 下一篇

猜你喜欢

热点阅读