数据仓库

第五章 数据仓库和技术

2018-12-17  本文已影响9人  晨磊的微博

[TOC]

第五章 数据仓库和技术

5.0 概述

5.1 管理大量数据(的技术)

5.2 管理多种介质(的技术)

5.3 索引和监控数据(的技术)

5.4 多种技术的接口(的技术)

graph LR
A[操作型环境和ODS] --> |导入|B(数据仓库)
B --> C{导出}
C --> D[数据集市]
C --> E[DSS应用]
C --> F[探查和数据挖掘]
C --> G[备用存储]

5.5 程序员/设计者对数据存放位置的控制

5.6 数据的并行存储和管理

元数据管理(业务元数据,技术元数据)
报表工具、业务智能工具、ODS环境、ETL 等都要有元数据

  • 表结构
  • 表属性
  • 源数据
  • 源数据到仓库的映射
  • 数据模型说明
  • 抽取日志
  • 访问数据的公用例行程序
  • 数据的定义/描述
  • 数据单元之间的关系

5.7 语言接口

一句话,只有程序员使用SQL,其他人要使用比SQL更简单的语言(那是什么呢?没说!!!)

5.8 数据的有效装载

单条载入:一次载入一条
批量载入:
并行装载:
缓冲处理

5.9 有效利用索引

高效索引访问技术

5.10 数据压缩

5.11 符合主键

5.12 变长数据

5.13 加锁管理

5.14 只涉及索引的处理

5.15 快速恢复

一句话,数据需要从非直接存储快速恢复成仓库的表

5.16 其他的技术特征(不需要的技术)

5.17 DBMS类型和数据仓库

5.18 改变DBMS技术

--

5.19 多维DBMS和数据仓库(跟Kimball不太一样)

数仓 多维
大量数据 少一个数量级
适合少了灵活访问 适合大量非预知访问
很长时间范围的数据 短时间范围的数据
受限访问 自由访问
与多维互补 与仓库互补

5.20 在多种存储介质上构建数据仓库

5.21 数据仓库环境中的元数据角色

5.22 上下文和内容

5.23 刷新数据仓库

5.24 测试问题

5.25 小结

上一篇 下一篇

猜你喜欢

热点阅读