Apache Druid大数据精进之路

OLAP简介

2019-01-29  本文已影响15人  it_zzy

OLAP简介


摘要

druid对于做大数据的同学们来说,并不陌生。我之前也研究过很多OLAP的框架,最近研究了一下最新版的druid(0.9.1.1), 想和大家在此分享一下,和大家一起学习进步。对于没有接触过BI和数据分析的同学,先给大家简单介绍一下OLAP,作为入门。

什么是OLAP(联机分析处理)

这个是和数据处理非常相关的一个概念。接触过BI(商务智能的同学一定清楚。数据处理大致可以分成两大类:联机事务处理OLTP(on-line transaction processing)、联机分析处理OLAP(On-Line Analytical Processing); OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。通俗的讲,就是对数据的增删改查等操作。 OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。通俗的讲,就是对数据按不同维度的聚合,维度的上钻,下卷等。

OLAP可以分为ROLAP,MOLAP和HOLAP

也就是说MOLAP是空间换时间,即把所有的分析情况都物化为物理表或者视图,查询的时候直接从相应的物化表中获取数据, 而ROLAP则通过按维度分库,分表等方式,实现单一维度下的快速查询,通过分布式框架,并行完成分析任务,来实现数据的分析功能。MOLAP 实现较简单,但当分析的维度很多时,数据量呈指数增长,而ROLAP在技术实现上要求更高,但扩展性也较好。

更多的关于OLAP的知识,推介大家看机械工业出版社出版的《数据挖掘-概念与技术》

上一篇 下一篇

猜你喜欢

热点阅读