2020-03-08 学习记录
2020-03-08 本文已影响0人
fan的心情记录
数据预处理
第一行代码输出前十行数据,发现有缺失值,age_is_null打印空值。若为空则显示true。age_null_true会把缺失数据打印出来。最后一行代码则可以显示出来一共有几个缺失值。
用平均值来替代缺失值
打印一二三等舱的平均价格mean_age=sum(data["age"])/len(data["age"])
print(mean_age) #打印出来是nan 因为元数据中有缺失值 所以计算不出来。讲非缺失的数据拿出来进行单独计算。
good_ages=data["age"][" age_is_null "=false]
correct_mean_age=sum( good_ages )/len( good_ages )
#也可以使用mean函数
data["age"].mean()也可以输出结果
可以直接用数据透视表(方便)
数据透视表 删除缺失值重新定义索引值 .rest_index
根据age来进行划分 三类 用分好类的age建立数据透视表