数仓建模

Data VauIt建模理论及应用场景

2018-05-28  本文已影响0人  尼小摩

DataVault模型

包含3种基本结构:

中心表——Hub

只包含业务主键信息以及数据装载的描述,不包含非键值以外的业务数据属性本身;比如中心表商品,在Data Vault下的设计:


中心表一般都会在创建一个主键Hub_商品ID,与业务商品ID无关,一般称为代理键或者附加键。
PS: 大家会发现这张中心表中没有商品属性信息;商品属性以及描述信息,都属于卫星表的范畴。

链接表——Link

链接表用来描述中心表间的关联关系,亦不包含业务键值以及数据装载描述以外的任何非键值数据,比如:学生授课链接表,其设计:



与授课相关的课时数等描述信息,都属于卫星表的范畴。

卫星表——Satellite

数仓中数据的主要载体,包括对链接表、中心表的数据描述、数值度量等信息,中心表商品、订单明细的卫星表分别如下:


案例:

对上一篇已经讨论到的学生选课ER模型,进行Data Vault模型重构,原模型:

原则:

  1. 梳理所有主要实体。
  2. 将有入边的实体定义为中心表
  3. 将没有入边且只有一个出边的表定义为中心表
  4. 源系统没有入边且有两条或以上出边的表定义为链接表
  5. 将外键关系定义为链接表

按Data Vault改造后的大概模型

上一篇 下一篇

猜你喜欢

热点阅读