【理论】数据挖掘知识入门

2018-08-19  本文已影响19人  needrunning

数据挖掘比较专业化的解释如下
Data mining (knowledge discovery from data)

KDD 是一个以知识使用者为中心,人机交互的探索过程,包括了在指定的数据库中用数据挖掘算法提取模型,以及围绕数据挖掘所进行的预处理和结果表达等一系列的步骤

什么是模型

比较官方的说法是通过数据挖掘过程所得到的知识通常被称为模型(model)或模式(pattern)
模型或者模式是数据挖掘的结果。

我对模型或者模式的理解是这样的,当你面对一个实际的数据分析需求时,首先你要做的就是如何获取和整理你的数据集,使之有用的呈现出来,并且合理的服务于之后的分析。如何进行数据集的获取,存储,呈现就是建立模型的过程,类比于Web应用程序开发中的数据建模,同数据表创建,定义实体及关联。

image

引用知乎中对ETL的解释

ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。 ETL是BI项目重要的一个环节。 通常情况下,在BI项目中ETL会花掉整个项目的1/3的时间,ETL设计的好坏直接关接到BI项目的成败。

作者:李晓文

链接:https://www.zhihu.com/question/26528031/answer/57860607

来源:知乎

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

上一篇下一篇

猜你喜欢

热点阅读