titanic生存率分析
2017-04-25 本文已影响0人
巴拉巴拉_9515
本文主要分析舱位等级、年龄、性别与生存率的关系
1、titanic原始数据
原始数据介绍
Survived:表示人员生存情况,1表示存活,0表示死亡
pclass表示舱位等级,1表示上等舱,2表示中等舱,3表示下等舱
Name,sex,age表示乘客姓名,性别,年龄
titanic原始数据2、舱位等级与生存率关系
统计存活人数
> table(train$Survived)
0 1
549 342
统计三个等级船舱人数
> table(train$Pclass)
1 2 3
216 184 491
统计三个等级船舱存活人数
高等舱:存活136人,死亡80人
中等舱:存活87人,死亡97人
低等舱:存活119人,死亡372人
船舱等级存活率计算
各等级存活率=存活人数/各等级总人数
高等舱存活率为0.63;中等舱存活率为0.47;低等舱存活率为0.24
船舱等级与存活率间关系
船舱等级越高,存活率越高
高等舱,中等舱,低等舱存活率3、年龄与生存率关系
部分乘客的年龄信息暂缺,故需将缺少年龄的字段删除,删除后字段条数为714条字段。
titanic乘客各年龄段分布情况
titanic号乘客主要为青少年(8-25)和壮年(25-45)
各年龄段乘客分布各年龄段存活率
童年,青少年,中年的存活率比较高
老年0.091
青少年0.356
童年0.680
中年0.402
壮年0.413
各年龄段存活率4、性别与生存率关系
女性的存活率为0.742,;男性存活率为0.189。女性存活率明显高于男性
乘客男女存活率