机器学习与数据挖掘机器学习之数据挖掘

课堂 | 如何轻松有效地预处理数据

2018-11-08  本文已影响7人  Kofe_

作者:Siraj Raval
课堂:The Best Way to Prepare a Dataset Easily | Bilibili | Youtube
源码:llSourcell.Prepare dataset challenge | Github
转载:出于篇幅原因,若需要更好索引阅读,请参阅 原博文

本课堂的核心是讲述数据分析前夕的数据预处理过程,包括准备数据阶段和处理数据阶段。再具体以实例:通过大脑扫描公共数据集来分析、建模,预测某人是否在冥想。

准备数据

公共数据集

谷歌高级搜索

Kaggle

网络爬虫

网站 API

网页爬虫

处理数据

数据清洗

数据归约

数据变换

参考资料

[1] Jiewei Han, Micheline Kamber and Jian Pei. 数据挖掘 (第三版) [M]. 机械工业出版社, 2018, 48-49.

上一篇 下一篇

猜你喜欢

热点阅读