数据仓库和维度建模
2019-01-18 本文已影响0人
Hunter严
数据仓库的优化
业务方面优化
如订单及时跟单率只能达到80%,另外的百分之二十需要根据goshop时间,淘宝订单后四位,订单时间进行轮询匹配用户ID,再分配业务线
之前订单是所有两步完成再进行后面的任务,现在拆分任务订单匹配任务完成就开始那些不需要拆分业务线的任务开始运行,分配业务线的任务完成再调度需要依赖他的任务开始
数据仓库分层建设
1)ods层:原始数据直接同步过来;ODS作为数据缓冲层,保留的是所有的数据,理论上粒度和源系统保持一致,同时不丢数据,业务DB基本上是直接同步过来,LOG主要是做结构化。
2)维表和事实表层:该主要是将ods的数据经过规范化处理、业务逻辑处理等得到的。在该层以后使用的所有数据都必须且只能来自该层,不能再从ods层提取。
3)主题层:主要将维表和事实层的数据按照相同的业务主题进行整合得到。
4)聚合层:在事实层和主题层的基础上,按照业务需求对数据进行相应的汇总,直接面向应用层。
5)应用层:主要用于生成报表,展现给需求方。
6)临时层:用于存放开发过程中的一些临时表。
数据仓库维度建模
分析业务过程需求调研-数据探查-确定事实-确定维度-确定命名-详细设计
https://segmentfault.com/a/1190000016199946 --良好的分层模型