我爱编程

数据分析过程(准备工作)

2018-01-23  本文已影响0人  esskeetit

数据集→提出问题→进行调查
本课所用到的库numpy,pandas,matplotlib

如果你已安装 Anaconda,为确保其为最新版本,请打开命令提示符或终端行界面(参见以下说明),运行命令:

conda update conda 
conda update anaconda

所用文件:

enrollments.csv:

数据分析纳米学位学员中,完成了第一个项目的学员的一个随机子集的数据,以及没有完成第一个项目的学员的一个随机子集的数据。

字段:

daily_engagement.csv

报名注册表中每一位学生,在数据分析纳米学位的日常参与学习数据。即使当天没有参与学习,也留有记录。还包含纳米学位的支持课程的参与学习数据,以及相应的具有相同内容的免费课程的参与学习数据。

字段:

project_submissions.csv

关于在报名注册表中的每个学生提交数据分析纳米学位项目的数据。

字段:

daily_engagement_full.csv

与 daily_engagement.csv 类似,但是进一步细分课程和更多可以用的字段。这个文件大概是 500M,我们我们提供了体积更小的 daily_engagement.csv。这个数据集是可选的,不是完成这个作业所必需的。

除了下面的这些字段,这个文件包括 daily_engagement.csv 中的所有字段,但是用 has_visited 代替了 num_courses_visited。

字段:

上一篇 下一篇

猜你喜欢

热点阅读