titanic生存率分析

2017-04-25  本文已影响0人  巴拉巴拉_9515

参考文献:titanic生存率分析参考文献

本文主要分析舱位等级、年龄、性别与生存率的关系

1、titanic原始数据

原始数据介绍

Survived:表示人员生存情况,1表示存活,0表示死亡

pclass表示舱位等级,1表示上等舱,2表示中等舱,3表示下等舱

Name,sex,age表示乘客姓名,性别,年龄

titanic原始数据

2、舱位等级与生存率关系

统计存活人数

> table(train$Survived)

0      1

549 342

统计三个等级船舱人数

> table(train$Pclass)

1       2     3

216 184 491

统计三个等级船舱存活人数

高等舱:存活136人,死亡80人

中等舱:存活87人,死亡97人

低等舱:存活119人,死亡372人

船舱等级存活率计算

各等级存活率=存活人数/各等级总人数

高等舱存活率为0.63;中等舱存活率为0.47;低等舱存活率为0.24

船舱等级与存活率间关系

船舱等级越高,存活率越高

高等舱,中等舱,低等舱存活率

3、年龄与生存率关系

部分乘客的年龄信息暂缺,故需将缺少年龄的字段删除,删除后字段条数为714条字段。

titanic乘客各年龄段分布情况

titanic号乘客主要为青少年(8-25)和壮年(25-45)

各年龄段乘客分布

各年龄段存活率

童年,青少年,中年的存活率比较高

老年0.091

青少年0.356

童年0.680

中年0.402

壮年0.413

各年龄段存活率

4、性别与生存率关系

女性的存活率为0.742,;男性存活率为0.189。女性存活率明显高于男性

乘客男女存活率
上一篇下一篇

猜你喜欢

热点阅读