何为决策树和随机森林?
2022-03-13 本文已影响0人
期待未来
随机森林
- 定义:随机森林或随机决策森林是用于分类、回归和其他任务的集成学习方法。
- 名字由来:随机森林就是使用随机的方法重新构建大量的决策树,根据多个决策树分类结果的“少数服从多数”的原则来完成对新数据的分类预测。
- 决策树概念:分类树(决策树)是一种十分常用的分类方法。它是一种监督学习,所谓监督学习就是给定一堆样本,每个样本都有一组属性和一个类别,这些类别是事先确定的,那么通过学习得到一个分类器,这个分类器能够对新出现的对象给出正确的分类。这样的机器学习就被称之为监督学习。
- 应用:机器学习,其是一个包含多个决策树的分类器
- 构建:
- 构建bootstrap数据集;
- 创建bootstrap数据集的决策树;
- 如此重复很多次,树多成林,就完成了随机森林的构建
[1]董师师,黄哲学. 随机森林理论浅析[J]. 集成技术,2013,01:1-7.
[2]李欣海. 随机森林模型在分类与回归分析中的应用[J]. 应用昆虫学报,2013,04:1190-1197.