模型验证与参数调整丨数析学院

2017-06-09 本文已影响84人 Datartisan数据工匠

本节我们将继续基于 Scikit-Learn 库的相关模块，向大家介绍 Python 中一些模型验证及调优的工具。

为了方便后续的演示，首先导入示例数据集 iris，并对数据特征与标记（即模型的自变量与因变量）进行提取划分：

我们构建一个 KNN 分类模型 model，用于验证准备：

模型拟合与预测：

导入 metrics 模块的 accuracy_score 函数，该函数能够帮助我们计算模型的准确率：

交叉验证是机器学习中常用的模型验证方法，这需要我们将数据集划分为训练集与验证集，cross_validation 模块中的 train_test_split 函数能够帮助我们实现较轻松的划分：

未完待续：课程内容较多，请复制链接通过电脑学习，获得最佳学习效果。 http://datacademy.io/lesson/138
更多课程和文章尽在微信号：「datartisan数据工匠」