分析师要懂的数仓知识

2017-12-07  本文已影响268人  成鹏9

为什么学数据仓库

工作中经常去数据库中找数据做分析,也和数仓同事对接过,做过一些表,但是只是对一些固定的事实和维度表熟悉,对数仓的整体架构、运作流程却没有一个大概的了解。学习数据仓库是为了对数据来源、数据生产方式以及数据呈现方式有一个概览。其一是加深自己对数据的技术层面上的了解,其二是方便之后和数仓同学的沟通。

为什么要有数据仓库

一个技术的出现,必定是为了解决一个需求。数据仓库技术的出现,我认为需求是来自于公司管理层、分析师和业务方,他们想要快速、高效、准确的了解公司的运营数据,以便快速决策和迭代公司运营策略,提升公司的竞争力。有了这个需求点,我们就可以知道为什么不用公司操作型数据库作为数据来源,而专门建设一个数据仓库,以承载企业内部的分析需求。因为操作型数据库不能针对特定主题查看数据,而且当数据比较大的时候,查询速度会比较慢。而且公司的操作型数据库是面向用户的,因为客户的需求是数据快速响应,导致操作型数据库基本上都是是零散且无主题的。

什么是数据仓库

数据仓库之父Inmon对数据仓库的定义是:是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,它用于支持企业或组织的决策分析处理。

数据仓库的构成

数据仓库系统的体系结构:


image.png

数据仓库的术语

数据仓库构建方法

上一篇下一篇

猜你喜欢

热点阅读