01.数仓常见概念术语

2021-10-15  本文已影响0人  木讷DATA

前两天看了大鱼先生写了一篇数仓中指标-标签、维度-度量、自然键-代理键的文章,对于数仓中的各种概念又有新的理解和认识。写一篇做备忘。本文主要从三组概念来进行对比说明;
先来看几个单独的概念,这几个也是数仓模型构建的前提准备

  1. 度量
    度量是业务流程节点上的一个数值。比如:用水量、耗电量、温度等。
    度量可分为:完全可加(全维度可进行计算)、半可加(部分维度可进行计算)、不可加(全维度不可进行计算,例如利率,在BI设计中,需在最上层报表中进行添加计算项)
  2. 粒度
    粒度是业务流程中对度量的统计实体。比如:用水量,按照单设备进行统计还是某一型号设备进行统计。
  3. 口径
    口径是需求统计的范围。比如:统计近一个月某个设备的用水量,近一个月和某个设备就是对应需求的统计口径。

1. 实体表、事实表、维度表之间的关系

举一个例子:比如某个商店中有海尔电视、海信电视、索尼电视等,这些数据共同组成了一个电视实体表,并表中不含有可度量的数据。商店某天出售5台海尔电视、10台海信电视、1台索尼电视,这些电视销售数据就组成了一个事实表。这样从时间维度就可以对该商店的销售量进行统计分析了。

2. 指标-标签-分类-属性

举个例子:某家庭,客厅中有一个立柜空调、卧室有一个挂机空调,两种空调即为两种分类,对于空调来说也是它的属性。某个月份,该家庭用电180千瓦时,高于70%家庭用电量划分为高用电量家庭,其中180千瓦时就是指标,高用电量用户,为该家庭打上的标签。

3. 自然键-代理键-持久键

参考 大鱼的数据人生五分钟学大数据

上一篇 下一篇

猜你喜欢

热点阅读