数据仓库

2019-10-27  本文已影响0人  VisionOfQuinn

数据仓库不同于数据库,数据库是对实时数据进行存储和事务性处理的系统,对应的操作包括了新增数据或是对数据进行修改和查询,但是在数据仓库中通常只对数据进行查询操作。

简单地说,数据库是为捕获数据而设计的,数据仓库是为分析数据而设计的。以银行交易系统为例,每一笔交易数据(包括金额流入流出)都在数据库里有完整的记录,这种记录都是格式化的业务型数据。在数据仓库中,存储的数据结构要比在业务数据库里冗余,在数据仓库里的数据可以被用来分析银行一个月内发生了多少交易额,也可以统计分析出在哪个时段内现金的流入或流出是最高的。在数据库里,我们存储的都是与业务相关的数据,在数据仓库里也会存储与业务相关的很多冗余数据,并且我们认为这种冗余是非常有必要的。

在实际生产中,数据仓库是基于数据决策的根基,当需要根据某一目的进行数据指标分析查询时,就可以在数据仓库中进行相关数据的组合查询和分析,产出的就是基于某一目的的数据报表。举个例子,在电商业务中,如果我们要分析过去一个月内三星手机的销量和地域分布时,就可以从数据仓库中组合“三星手机”“时间维度”“地域维度”这三个查询指标,通过组合数据导出数据查询结果并形成报表,决策者可以根据数据仓库生成的数据报表进行下一步决策。数据仓库的数据来源都是从业务数据库导出的,每天业务数据库都会产生大量的生产数据,定期将这些数据导入数据仓库可以为后续进行历史数据查询分析并制作目的数据报表提供数据来源。

上一篇 下一篇

猜你喜欢

热点阅读