机器学习与深度学习

36、通过数据预处理提高模型精度

2019-03-01  本文已影响35人  攻城狮笔记

数据准备可以决定您模型的预测能力。

在这篇文章中,您将发现可用于提高模型预测能力的数据预处理步骤。

我喜欢电子表格

我喜欢Spreadsheets
照片由Craig Chew-Molding拍摄,保留一些权利

数据准备

在建模问题之前,您必须预先处理原始数据。具体准备工作可能取决于您可用的数据和您要使用的机器学习算法。

有时,数据的预处理可能会导致模型精度的意外改善。这可能是因为数据中的关系已被简化或未被遮挡。

数据准备是一个重要的步骤,您应该尝试适合您的数据的数据预处理步骤,看看您是否可以获得模型精度的理想提升。

您可以为数据考虑三种类型的预处理:

我们将深入研究这三种预处理中的每一种,并查看您可以执行的一些特定操作示例。

添加数据属性

高级模型可以从复杂属性中提取关系,尽管某些模型要求明确说明这些关系。从训练数据中获取新属性以包含在建模过程中可以提高模型性能。

删除数据属性

某些方法在冗余或重复属性方面表现不佳。通过从数据中删除属性,可以提高模型的准确性。

转换数据属性

训练数据的变换可以减少数据的偏度以及数据中异常值的突出性。许多模型希望在应用算法之前转换数据。

摘要

数据预处理是准备原始数据进行建模,满足特定机器学习算法数据期望所需的重要步骤,并且可以在模型精度方面带来意想不到的提升。

在这篇文章中,我们发现了三组数据预处理方法:

下次您希望提高模型精度时,请考虑您可以为数据设计哪些新视角,以便模型进行探索和利用。

上一篇 下一篇

猜你喜欢

热点阅读