数据挖掘基本概念
2017-09-20 本文已影响0人
编程回忆录
- 数据挖掘是从海量数据中发现有趣模式的过程。作为知识发现过程,它通常包括数据清理、数据集成、数据变换、模式发现、模式评估和知识表示。
- 数据仓库是一种长期存储数据的仓库,这些数据来自多个数据源,是经过组织的,以便支持管理决策。这些数据在一种统一的模式下存放,并且通常都是汇总的。数据仓库提供一些数据分析能力,称做联机分析处理。
- 多维数据挖掘又称探索式多维数据挖掘,把数据挖掘的核心技术与基于OLAP的多维分析结合在一起。它在不同的抽象层的多维(属性)组合中搜索有趣的模式,从而探索多维数据空间。
- 数据挖掘功能用来指定数据挖掘任务发现的模式或知识类型,包括特征化和区分,频繁模式、关联和相关性挖掘,分类和回归,聚类分析和离群点检测。随着新的数据类型、新的应用和新的分析需求的不断出现,毫无疑问,将来我们会看到越来越新颖的数据挖掘任务。