python数据分析人工智能机器学习软件测试Python专家之路程序员

数据仓库快速入门教程6-OLAP

2019-05-01  本文已影响20人  python测试开发

什么是在线分析处理?

OLAP(Online Analytical Processing)允许用户同时分析来自多个数据库系统的信息。 这项技术使分析师能够从不同的角度提取和查看业务数据。

分析师经常需要分组,汇总和加入数据。 关系数据库中的这些操作是资源密集型的。 使用OLAP数据可以预先计算和预先聚合,从而加快分析速度。

OLAP数据库分为一个或多个多维数据集。 立方体的设计使得创建和查看报告变得容易。

OLAP多维数据集:

image

OLAP的核心是OLAP多维数据集。 OLAP多维数据集是为快速数据分析而优化的数据结构。

OLAP多维数据集由称为度量的数字事实组成,这些度量按维度分类。 OLAP Cube也称为超立方体

通常,使用简单的电子表格执行数据操作和分析,其中数据值以行和列格式排列。 这是二维数据的理想选择。 但是,OLAP包含多维数据,数据通常从不同且不相关的源获取。 使用电子表格不是最佳选择。 多维数据集可以以逻辑和有序的方式存储和分析多维数据。

它是如何工作的?

数据仓库将从多个数据源和格式中提取信息,如文本文件,Excel工作表,多媒体文件等。

提取的数据被清理和转换。 将数据加载到OLAP服务器(或OLAP多维数据集)中,在这里预先计算信息以供进一步分析。

OLAP的基本分析操作

OLAP中的四种分析操作是:

  1. Roll-up 汇聚
  2. Drill-down 下沉
  3. Slice and dice 切片和骰子
  4. Pivot 旋转

1) Roll-up :

汇总也称为“合并”或“聚合”。 有两种方式

  1. 减少尺寸
  2. 概念层次结构是一种根据订单或级别对事物进行分组的系统。

image

2)下沉

image

3)切片:

选择维度,创建新的子多维数据集。

下图说明了切片操作的执行方式:

image

Dice:

类似于切片。 不同之处在于您选择了2个或更多维度,从而导致创建子多维数据集。

image

4)枢轴

在Pivot中,您可以旋转数据轴以提供数据的替代表示。

在以下示例中,数据透视表基于项类型。

image

OLAP系统的类型

OLAP分层结构

image
OLAP的类型 说明
关系OLAP(ROLAP): 扩展的RDBMS以及多维数据映射,以执行标准的关系操作。
多维OLAP(MOLAP) 在多维数据中实现操作。
混合在线分析处理(HOLAP) 在HOLAP方法中,聚合总计存储在多维数据库中,而详细数据存储在关系数据库中。 这提供了ROLAP模型的数据效率和MOLAP模型的性能。
桌面OLAP(DOLAP) 在桌面OLAP中,用户从本地或在桌面上从数据库下载部分数据并进行分析。 DOLAP的部署成本相对较低,因为与其他OLAP系统相比,它提供的功能非常少。
Web OLAP(WOLAP) 可以通过Web浏览器访问OLAP系统的Web OLAP。 WOLAP是一个三层架构。 它由三个组件组成:客户端,中间件和数据库服务器。
移动OLAP: Mobile OLAP可帮助用户使用移动设备访问和分析OLAP数据
空间OLAP: 创建SOLAP是为了便于管理地理信息系统(GIS)中的空间和非空间数据

ROLAP

ROLAP使用关系数据库中存在的数据。 事实和维度表存储为关系表。 它还允许对数据进行多维分析,是增长最快的OLAP。

ROLAP模型的优点:

ROLAP模型的缺点:

MOLAP

MOLAP使用基于数组的多维存储引擎来显示数据的多维视图。 基本上,他们使用OLAP多维数据集。

参考资料

混合OLAP

混合OLAP是ROLAP和MOLAP的混合体。 它提供了MOLAP的快速计算和ROLAP的更高可扩展性。 HOLAP使用两个数据库。

  1. 聚合或计算数据存储在多维OLAP多维数据集中
  2. 详细信息存储在关系数据库中。

混合OLAP的好处:

混合OLAP的缺点:

OLAP的优点

OLAP的缺点

摘要:

上一篇 下一篇

猜你喜欢

热点阅读