简单的数据获取和处理流程丨数析学院

2017-07-21  本文已影响38人  Datartisan数据工匠

课程简介

本节将以婴儿名字数据集为例,向大家介绍 pandas 库数据的读取以及简单的处理和可视化工具。

数据来源 - 自行创建婴儿的名字以及数量数据集。
数据准备 - 从自行创建的数据集中读取所需数据,并进行缺失、异常数据的查看及处理。
分析目标 - 简单地找到在 1880 年最流行的名字。
数据可视化 - 通过表格数据和图表,清晰地展示分析结果。
首先导入 pandas 和 matplotlib 库:

1
2

创建数据

数据集由1880年出生5个婴儿名字和对应名字数量组成

3

为了合并这两条列表,使用 zip 方法

5

未完待续:课程内容较多,请复制链接通过电脑学习,获得最佳学习效果。 http://datacademy.io/lesson/150
更多课程和文章尽在微信号:「datartisan数据工匠」

上一篇 下一篇

猜你喜欢

热点阅读