大数据干货精选亦策大数据平台@IT·互联网

浅谈数据仓库

2017-05-22  本文已影响91人  度她余生

首先说说BI,我的理解BI包括DW,ETL和相应的可视化软件,现在一般的公司说要上个BI系统其实都是要从DW建模开始做,然后ETL,最后做对应的前端报表工具,虽然最终领导们只看到了自己想要的报表,但是这一套系统是需要DW和ETL支持才能更好的服务终端输出的报表。而数据仓库,英文就是DW(DateWarehouse)就好比地基,是整个一套BI流程中的基础,只有做好了DW才能为之后的ETL,报表展现打下坚实的基础。

数据仓库的特性

标题标题

数据仓库(DW)与传统的数据库(Datebase)是不同的。数据库是未经整理的数据集合;数据仓库是从数据库中抽取出来,经过整理、规划、建构而形成的已个系统的数据库的子集合。数据仓库具有下列集中特性:

一、面向主体(Subject Orient)

数据仓库的信息系统,数据建立的着重点在于以重要的主题组件为核心,作为建构的方向。数据需求者只要把要研究的相关主题数据,从数据库中抽取、整合之后就可以做研究分析。

二、集成性(Integrated)

各应用系统的数据需经过整合,以方便执行相关分析作业。

三、时变性(Time Variance)

数据仓库系统,为了执行趋势的分析,常需保留1~10年的历史数据。这与数据库保留日常性的数据有所不同。

四、稳定性(Non-Volatile)

数据库的数据可以随时被改动,但是数据仓库的数据,并非日常性的数据而是历史性的数据,通常作为长期性分析用途,只有内部相关人员会定期地修改数据结构,但频率不会太高,数据仓库并不允许使用者去做更新,所以其数据较少变动。

如果不将搜集的数据库先行整理、清理、归类、系统化,我们将无法从庞大的数据库中取得想要的数据进行分析。唯有先将数据库转换为数据仓库,才能从中获取想要的信息,否则数据库中的数据仍只是一些数字和文字,并不能成为企业决策的参考。

说了这么多,只是想表达DW重要性,更是整个BI的重中之重。如果没有DW,而把整个BI流程都交给报表工具去做,甚至是不做,那对于前端工具来说压力未免太大,毕竟可视化软件只是用作把有效的数据转变成更直观的图形展现出来。

上一篇 下一篇

猜你喜欢

热点阅读