STAR SCHEMA(二)
一. Inmon的企业信息化工厂
Untitled.png (1016×841) (amazonaws.com)
Inmon体系结构的简化视图:企业信息化工厂
企业数据仓库是企业信息化工厂的枢纽.它是原子数据的集成仓库,从各种操作型系统集成而来,包含一个确定且一致的业务活动表示法.基于原子数据的性质,该仓库尽可能地包含最底层的细节数据
在企业信息化工厂体系结构中,企业数据仓库不是通过分析型应用程序,商务智能工具或类似方法来直接查询.相反,它的目的是将附加的数据存储用于各种分析型系统.企业数据仓库通常存储于关系型数据库管理系统中,并且Inmon主张使用第三范式进行数据库设计
数据集市作为分析型活动的焦点,它可能包含查询,报告以及其他许多活动.这些活动可以利用各种不同的工具,包括商务智能工具和报表工具
二. Kimball的维度数据仓库
Untitled.png (1103×609) (amazonaws.com)
维度数据仓库
维度数据仓库与企业数据仓库有两个重要区别.首先,维度数据仓库是根据维度建模的原则来设计的.它由一系列星型模式或多维数据集组成,并由它们获取尽可能详尽的细节数据.这一点与Inmon的方法形成鲜明对比,Inmon的企业数据仓库是遵循ER模型的原则来设计的.其次,维度数据仓库也许能被分析型系统直接访问.虽然这种直接访问方式不是必要的,但这种体系结构显然允许该方式存在.数据集市的概念有着逻辑上的区别,数据集市是数据仓库中的主题区域
在体系结构的另一个可接受的变化版本中,构建者选择将维度数据仓库与分析型应用程序的直接访问隔离开来。此时,新的数据集市由从维度数据仓库中提取出的数据构成.这些数据集市可能聚集了维度数据,甚至将它们重组成新的维度体系结构.此外,数据集市被看作完整的原子数据仓库中的单独实体,这些变化增加了维度数据仓库与企业信息化工厂的相似之处
三. 独立型数据集市
独立型数据集市是一个分析型数据存储,并不是在企业环境中被设计的,它只关注于主题区域.一个或多个操作型系统可以满足一个被称作数据集市的数据库.数据集市可能采用维度设计,实体关系模型或是其他形式的设计.分析型工具或应用程序对它直接进行查询,然后将结果反馈给最终用户
Untitled.png (965×337) (amazonaws.com)
独立型数据集市
单个的独立型数据集市似乎是最有效率的获取结果的方法,但多重独立型数据集市的出现会导致效率低下.在多重ETL进程从相同的源系统中加载数据,数据集市本身可能是基于不同的技术,并且用户群体可能依赖于各自的查询和报表基础设施,这些特性经常使独立型数据集市带有“信息孤岛”的标记,即缺乏兼容性.(这是由于独立型数据集市只关注有限范围这一缺陷造成的)