python数据分析处理库-Pandas
import pandas as pd # 导入pandas库,并重命名为pd
a = pd.read_csv("1.csv") # 读取csv文件
print(type(a)) # 打印a的类型
print(a.dtypes) # 打印csv文件里各字段类型
print("-----------------------------------")
print(a.head()) # 默认显示csv文件里前五条数据
print(a.head(3)) # 3表示显示csv里前三条数据
print(a.tail()) # 默认显示csv文件里后五条数据
print(a.tail(3)) # 3表示显示csv里后三条数据
print("-----------------------------------")
print(a.columns) # 打印csv文件里的列名
print(a.shape) # 打印csv文件行数,列数
print("-----------------------------------")
print(a.loc[0]) # 获取csv文件里第一行数据
print(a.loc[6]) # 获取csv文件里第七行数据 ,[]里的数字代表索引值
print(a.loc[0:2]) # 获取csv文件里第一,二,三行数据
print("--------------获取列名以len结尾的数据---------------------")
column_names = a.columns.tolist() # 获取列名
gram_columns = [] # 用来存放以len结尾的列名
for c in column_names: # 循环遍历列名
if c.endswith("len"): # 判断是否是以len结尾的列
gram_columns.append(c) # 是就加入数组里
new_column = a[gram_columns] # 所有列名以len结尾的数据
print(new_column.head(3)) # 打印前三行
print("-----------------------------------")
sepal_new = a["sepal_len"] * a["sepal_width"] # 对文件的数据进行乘法计算
print(sepal_new[0:3]) # 打印前三行
a["sepal_new"] = sepal_new # 创建一个新的列,并赋值
print(a.head(3))
print("-----------------------------------")
a.sort_values("sepal_new", inplace=True) # 对sepal_new进行排序,默认为升序,inplace在原来基础上进行修改
print(a["sepal_new"][0:3])
a.sort_values("sepal_new", inplace=True, ascending=False) # 降序
print(a["sepal_new"][0:3])
print("-----------------------------------")