python实现随机森林算法
2017-10-12 本文已影响11人
眼君
用决策树实现一个根据用户的信息判断用户是否逾期的分类算法代码实现。
首先,我们对数据进行预处理,填充缺失值,数据集的标签特征为‘还款状态’,包括‘按时还款’、‘部分逾期’、‘全部逾期’三个特征值。

写两个函数,分别用于获取数据集的香农熵并划分数据集。

封装以上函数,形成一个用于判断最好数据集划分的函数。

进一步封装,写一个函数用于递归创建决策树,生成的决策树是一个字典结构。

创建两个函数分别用于构建决策树并用决策树进行判断。

封装构建决策树的功能,形成一个构建随机森林对象的函数,形成的随机森林是一个列表结构。

用测试数据进行验证。

