第一章 决策支持系统(DSS)的发展
2018-12-08 本文已影响29人
晨磊的微博
第一章 决策支持系统(DSS)的发展
1.0 从整体入手,逐步解决细节问题
- 建造桥梁,不仅要知道如何铺水泥、如何钻孔、如何安装螺母等,也要了解桥梁的外型和用途
- 即使所有细节都正确也不一定能保证最终产品必然成功
1.1 演化
1.1.1 自然演化结构的流程图
image.png1.2 自然演化结构的问题(3个)
1.2.1 数据缺乏可信度(问题1)
- 多部门提供的同一业务统计结果不同
- 主要的原因有如下5个
- 数据源不一致
- 计算规则不一致
- 数据选取的时间不一致
- 引用了不同的第三方数据
- 各自抽取中的数据遗漏
1.2.2 生成效率低(问题2)
- 数据过于分散,数据定位困难
- 数据描述不一致,难以确定准确数据
- 每个业务,每个报表都会遇到以上问题
1.2.3 无法将数据转化为信息(问题3)
- 缺少集成
- 没有历史数据
1.2.4 方法的变迁
- 认清数据的差异(原始数据与导出数据)
- 应用方面
原始数据:面向事务、为日常工作服务
导出数据:面向分析、为管理者服务 - 存储:
原始数据:明细、瞬时、非冗余
导出数据:概要、快照、总冗余 - 访问
原始数据:可更新、性能高、单条访问、频繁访问
导出数据:不更新、性能低、集合访问、很少访问
- 应用方面
1.2.5 体系结构环境(企业信息源的基石)
image.png- 操作层:面向应用 --> 用户A当前是否会员
- 仓库层:集成自操作层的历史原始数据 --> 用户A历史上哪些时间段是会员
- 集市层:部门级仓库 --> 近两年每月会员人数
- 个体层:启发式分析 --> 会员增长趋势分析
1.2.6 体系结构环境中的ETL集成
- 操作层 数据至 仓库层 时,必须ETL集成
1.2.7 用户是谁(面向用户的不同)
- 分析人员,首先是商务人员,其次才是技术人员
- 分析人员口头禅“给我看一下现在有什么,我才能告诉你我需要什么”
1.3 开发生命周期(的不同)
- OLTP:瀑布式(需求-程序-结束)
- 数据仓库:螺旋式(仓库-程序-需求)
1.4 硬件利用模式(的不同)
- OLTP:可预测稳定
- 数据仓库:要么全用,要么不用
1.5 为重建工程创作条件(间接副作用)
- 移走大量档案数据
- 移走数据统计工作
- 生产系统更容易重构
1.6 监控数据仓库环境
-
数据的监控
-
数据使用情况的监控
-
仓库所有表的目录、表的内容概念、增长情况、依赖情况