玩转大数据大数据机器学习与数据挖掘

模型验证与参数调整丨数析学院

2017-06-09  本文已影响84人  Datartisan数据工匠

本节我们将继续基于 Scikit-Learn 库的相关模块,向大家介绍 Python 中一些模型验证及调优的工具。

为了方便后续的演示,首先导入示例数据集 iris,并对数据特征与标记(即模型的自变量与因变量)进行提取划分:

1

我们构建一个 KNN 分类模型 model,用于验证准备:

2

模型拟合与预测:

3

导入 metrics 模块的 accuracy_score 函数,该函数能够帮助我们计算模型的准确率:

4

交叉验证是机器学习中常用的模型验证方法,这需要我们将数据集划分为训练集与验证集,cross_validation 模块中的 train_test_split 函数能够帮助我们实现较轻松的划分:

5

未完待续:课程内容较多,请复制链接通过电脑学习,获得最佳学习效果。 http://datacademy.io/lesson/138
更多课程和文章尽在微信号:「datartisan数据工匠」

上一篇下一篇

猜你喜欢

热点阅读