Hadoop大数据

二.维度建模技术

2019-08-08  本文已影响2人  阿猫阿狗Hakuna

一.基本概念

1.收集业务需求与数据实现

理解业务需求。

2.协作维度建模研讨

维度模型应由主题专家与企业数据管理代表合作设计而成。

3.维度设计4步骤

维度模型设计期间涉及4个主要决策:
(1)选择业务过程
(2)声明粒度
(3)确认维度
(4)确认事实

4.业务过程

业务过程是组织完成的操作型活动,比如,获得订单。

5.粒度

粒度用于确定某一事实表中的行表示什么。

6.描述环境的维度

维度表时数据仓库的“灵魂”。

7.用于度量的事实

事实涉及来自业务过程事件的度量,基本都以数量值表示。

二.事实表技术基础

1.事实表结构

事实表设计完全依赖于物理活动,不受可能产生的最终报表的影响。
查询请求的主要目标是针对事实表开展计算和聚集操作。

2.可加、半可加、不可加事实

事实表中的数字度量可划分为三类:可加是最有用的,可以按照与事实表关联的任意维度汇总;半可加可以对某些维度汇总;不可加的,比如,比率。

3.事务事实表

事务事实表的一行对应空间或时间上某点的度量事件。

4.周期快照事实表

周期快照事实表中的每行汇总了发生在某一标准周期,如一天,一月的多个度量事件。

5.累积快照事实表

累积快照事实表的行汇总了发生在过程开始和结束之间可预测步骤内的度量事件。

6.聚集事实表

聚集事实表是对原子粒度事实表进行简单的数字化上卷操作,目的是为了提高查询性能。

三.维度表技术基础

1.维度表结构

每个维度表都包含单一的主键列。通常较宽,包含大量低粒度的文本属性。

2.维度代理键

维度表中会包含一个列,表示唯一主键,该主键不是操作型系统的自然键,而是按顺序分配的简单整数,从1开始,每当需要新建时,自动加1。

3.多层次维度

多数维度包含不只一个自然层次。例如,日历日期维度可以按照财务周期层次从天到周划分。

4.维度表中的空值属性

推荐采用描述性字符串替代空值。例如,Unknown。

上一篇下一篇

猜你喜欢

热点阅读