数据库仓库是什么

2019-03-11  本文已影响0人  猫咪娱乐

最近找工作开始发现了很多数据产品的岗位,薪资待遇也还不错。在互联网行业混迹了这么多年,大数据之前也接触过。看到些新的概念词,如:数据仓库

数据BI等不是很理解 就去百度了下:

 一、数据仓库是什么

  可以理解为:面向分析的存储系统。

  也就是说数仓是存数据的,企业的各种数据往里面塞,主要目的是为了有效分析数据,后续会基于它产出供分析挖掘的数据,或者数据应用需要的数据,如企业的分析性报告和各类报表,为企业的决策提供支持。

  上面的意思先理解着,接下来从头讲起,先看关系型数据库,它可以被划分为两大基本类型:操作型数据库和分析型数据库。

  1. 操作型数据库

  主要面向应用,用于业务支撑,支持对实际业务的处理,也可以叫业务型数据库。

  可以理解为通常意义上的数据库(后端开发同学口中的经常提到的就是这种)。

  2. 分析型数据库

  主要面向数据分析,侧重决策支持,作为公司的单独数据存储,负责利用历史数据对公司各主题域进行统计分析。

  由于分析型数据库中的操作都是查询,因此也就不需要严格满足关系型数据库一些设计规范,这样的情况下再将它归为数据库不太合适,也容易不引起混淆,所以称之为数据仓库。

  这里可以说一下,数据处理大致可以分成两大类:OLTP(联机事务处理)和OLAP(联机分析处理)。

  OLTP(联机事务处理)就是操作型数据库的主要应用,更侧重于基本的、日常的事务处理,包括数据的增删改查。

  OLAP(联机分析处理)就是分析型数据库的主要应用,以多维度的方式分析数据, 这个后续会整理。

 二、数据仓库有什么特点

  相对于数据库,数据仓库有以下特点

  (1)面向主题

  数据仓库通过一个个主题域将多个业务系统的数据加载到一起,为了各个主题(如:用户、订单、商品等)进行分析而建,操作型数据库是为了支撑各种业务而建立。

  (2)集成性

  数据仓库会将不同源数据库中的数据汇总到一起。

  (3)历史性

  较之操作型数据库,数据仓库的数据是为企业数据分析而建立,所以数据被加载后一般情况下将被长期保留,前者通常保存几个月,后者可能几年甚至几十年。

  (4)时变性

  是指数据仓库包含来自其时间范围不同时间段的数据快照,有了这些数据快照以后,用户便可将其汇总,生成各历史阶段的数据分析报告。

  (5)稳定性

  数据仓库中的数据一般仅执行查询操作,很少会有删除和更新。但是需定期加载和刷新数据。

这一些新的理论形成 对于没有接触过的确实难以理解,幸好小编做过一下数据分析,所以通俗的理解了下,大概如下三点:

1.数据库仓库,其实就是个抽象的概念,数据仓库的数据就是来自于业务数据库(就是我们开发哥哥往里面去增删改查的数据库)将业务数据库的数据经过清洗,也就是筛选后放入到数据库仓库里

2.对数据仓库的数据进行挖掘,即形成数据报表,数据分析,多个维度分析用户的属性和行为

3.通过这些数据来做出决策和运营手段

www.mmdyin.com

上一篇 下一篇

猜你喜欢

热点阅读