玩转大数据人工智能/模式识别/机器学习精华专题机器学习与数据挖掘

SKlearn实现--随机森林

2017-10-17  本文已影响588人  眼君

先用sk-learn构建一个决策树

对数据进行预处理:

数据预处理 处理后的数据

用sk-learns构建决策树有以下9个参数可以设置:

树模型参数

一般第4个和第5个使用比较多。

构造决策树

决策树构造成功后会返回其树模型参数。

树模型参数

决策树可视化

首先需要下载两个辅助模块:graphviz和pydotplus

http://www.graphviz.org/Download..php在这个网址下载安装对应系统的graphviz模块。

然后下载pydotplus

>>>pip3 install pydotplus

下载安装成功后就可以画出决策树了。

绘制决策树 绘制出的决策树

SK-learns的参数优化

我们先将数据集拆分成训练集和测试集对算法进行验证。

验证算法

下一步,我们需要对构造决策树的参数进行优化,这里需要用到一个模块GridSearchCV。

参数优化

随机森林实现

上一篇 下一篇

猜你喜欢

热点阅读