数据仓库-DW/BI架构对比-读书笔记二
2018-08-15 本文已影响20人
数据僧
Kimball的DW/BI架构
Kimball DW/BI 架构的核心元素 Kimball 分工明确,资源占用更加合理,调用链路少,整个DW/BI系统更加稳定、高效、有保障。
ETL系统高度关注数据质量、完整性、一致性。输入数据在进入时要检查其质量。一致的获取增值度量和属性的业务规则由ETL系统中的有技能的专业人员开发,这样会给客户发布更好的、保持一致性的产品。
展现区根据客户要求使用统一维度组织数据。方便,高效为BI应用提供数据服务。
独立数据集市架构
简化的独立数据集市架构 优点:不需要考虑跨组织的数据控制和协调的问题,从短期效果来看,有利于较低成本实现快速开发。
缺点:从长远来看,从相同的数据源重复获取数据,由于分析数据的冗余存储造成浪费和低效。
没有从全局考虑问题,会导致大量不同解决方案,这些方案参杂了对组织指标互不兼容的视图,将会导致企业无休止的争吵和不协调
辐射装企业信息工厂Inmon架构
简化的辐射状企业信息工厂架构 这种架构中企业数据仓库规范化是强制性的构件。但是这种规范化仅仅是建立在实现多对一关系的物理表。
Kimball架构关注解决数据不一致性,但并未明确提出需要规范化。此种架构包含聚集数据(不是原子级细节数据),不够灵活。
混合辐射状架构与Kimball架构
包含第3范式结构和维度Kimball展现区的混合架构 如果组织已经对企业做了投入,客户也不期望更加灵活实现报表和分析,这种方式可能非常适合。
如果组织什么也没有,混合方法可能需要更多的开销和事件,无论是在开发期间还是运行期间,因为数据需要多次移动。原子细节数据冗余存储。
成本高,开发周期长。
参考资料
数据仓库工具箱
如果您觉得我用心了,觉得您有所收获,麻烦关注下我吧,您的关注就是我的动力,因为我不是一个人在前行。
数据僧微信公众号