大数据玩转大数据

数据仓库-DW/BI架构对比-读书笔记二

2018-08-15  本文已影响20人  数据僧

Kimball的DW/BI架构

Kimball DW/BI 架构的核心元素

    Kimball 分工明确,资源占用更加合理,调用链路少,整个DW/BI系统更加稳定、高效、有保障。
    ETL系统高度关注数据质量、完整性、一致性。输入数据在进入时要检查其质量。一致的获取增值度量和属性的业务规则由ETL系统中的有技能的专业人员开发,这样会给客户发布更好的、保持一致性的产品。
    展现区根据客户要求使用统一维度组织数据。方便,高效为BI应用提供数据服务。

独立数据集市架构

简化的独立数据集市架构

    优点:不需要考虑跨组织的数据控制和协调的问题,从短期效果来看,有利于较低成本实现快速开发。
    缺点:从长远来看,从相同的数据源重复获取数据,由于分析数据的冗余存储造成浪费和低效。
    没有从全局考虑问题,会导致大量不同解决方案,这些方案参杂了对组织指标互不兼容的视图,将会导致企业无休止的争吵和不协调

辐射装企业信息工厂Inmon架构

简化的辐射状企业信息工厂架构

    这种架构中企业数据仓库规范化是强制性的构件。但是这种规范化仅仅是建立在实现多对一关系的物理表。
    Kimball架构关注解决数据不一致性,但并未明确提出需要规范化。此种架构包含聚集数据(不是原子级细节数据),不够灵活。

混合辐射状架构与Kimball架构

包含第3范式结构和维度Kimball展现区的混合架构

    如果组织已经对企业做了投入,客户也不期望更加灵活实现报表和分析,这种方式可能非常适合。
    如果组织什么也没有,混合方法可能需要更多的开销和事件,无论是在开发期间还是运行期间,因为数据需要多次移动。原子细节数据冗余存储。
    成本高,开发周期长。


参考资料

数据仓库工具箱


如果您觉得我用心了,觉得您有所收获,麻烦关注下我吧,您的关注就是我的动力,因为我不是一个人在前行。

数据僧微信公众号
上一篇下一篇

猜你喜欢

热点阅读