Data Engineering

3.1.1.8 集成学习

2017-12-28  本文已影响0人  hxiaom

集成学习

原理

《机器学习》周志华

8.1 个体与集成
8.2 Boosting
8.3 Bagging与随机森林
8.3.1 Bagging
8.3.2 随机森林
8.4 结合策略
8.4.1 平均法

对数值型输出,最常见的结合策略是使用平均法(averaging)

加权平均法的权重一般是从训练数据中学习而得,现实任务中的训练样本通常不充分或存在噪声,这将使得学出的权重不完全可靠,尤其是对规模比较大的集成来说,要学习的权重比较多,较容易导致过拟合。因此,实现和应用均显示出,加权平均法未必一定优于简单平均法。一般而言,在个体学习器性能相差较大时宜使用加权平均法,而个体学习器性能相近时宜使用简单平均法。

8.4.2 投票法

对分类任务来说, 学习器将从标记集合中预测出一个标记,最常见的结合策略是使用投票法(voting)。

标准的绝对多数投票法提供了“拒绝预测”选项,这在可靠性要求较高的学习任务中是一个很好的机制。但若学习任务要求必须提供预测结果,则绝对多数投票法将退化为相对多数投票法。因此,在不允许拒绝预测的任务中,绝对多数、相对多数投票法统称为“多数投票法”。

8.4.3 学习法
8.5 多样性
8.5.1 误差-分歧分解
8.5.2 多样性度量
8.5.3 多样性增强

Hello World

学术

工程

上一篇 下一篇

猜你喜欢

热点阅读