数据挖掘

2018-06-26  本文已影响18人  乘瓠散人

什么是数据挖掘

数据挖掘是在大型数据存储库中,自动地发现有用信息的过程。数据挖掘用来探查大型数据库,发现先前未知的有用模式。还可以预测未来观测结果。

数据预处理的目的是将未加工的输入数据转换成适合分析的形式。数据预处理设计的步骤包括融合来自多个数据源的数据,清洗数据,消除噪声和重复的观测值,选择与当前数据挖掘任务相关的记录和特征。由于收集和存储数据的方式多种多样,数据预处理可能是整个知识发现系统中最费力、最耗时的步骤。

后处理确保只将那些有效的和有用的结果集成到决策支持系统中。后处理的一个例子是可视化,它使得数据分析者可以从各种不同视角探查数据和数据挖掘的结果。在后处理阶段,还能使用统计度量或假设检验,删除虚假的数据挖掘结果。

数据挖掘任务

举例:

上一篇 下一篇

猜你喜欢

热点阅读