什么是数据中台
最近可能大家听到“数据中台”这个词越来越频繁了,身边朋友一直在聊这个话题,但是一直不知道这到底是个什么,具有什么样的结构。所以,今天跟大家分享一下什么是数据中台。
01 数据中台定义
我们平常所讨论的大数据平台, 很多人以为大数据平台就是数据中台,其实数据中台并不是大数据平台。首先数据中台不是一个平台,也不是一个系统,如果有相关的厂商说他们有个数据中台卖给你,对不起,它要么是个骗子要么就根本不了解数据中台。
要回答数据中台是什么,首先要探讨一下中台到底是什么。我们可以把中台看作是一种中间层。
首先我们可以通过探索 Gartner 的 Pace Layer 来理解为什么需要中间层,这样方便我们更好地理解中台的定位和价值。Gartner的Pace Layer 分层理论中提到,应用可以按照事物变化的速度来分层,这样便可以逐层分析并设计合理的边界与服务。
Pace Layer通过Gartner的分层理论可以看出,在数据开发中,核心数据模型的变化是相对缓慢的,同时,对数据进行维护的工作量也非常大;但业务创新的速度、对数据提出的需求的变化,是非常快速的。
因此,数据中台的出现,就是为了弥补数据开发和应用开发之间,由于开发速度与数据需求速度不匹配,从而出现的响应速度跟不上的问题。
数据中台解决的问题可以总结为如下三点:
解决问题-
效率问题:为什么应用开发增加一个报表,就要十几天的开发周期?为什么不能实时获得用户推荐清单?当业务人员对数据产生一点疑问的时候,需要花费很长的时间,结果发现是数据源的数据变了,最终影响上线时间。做为一名资深开发人员, 我们对此深有体会,数据源的变化会导致一些异常, 而排查异常却需要花费很长的时间,效率得不到有效的保障。
-
协作问题:当业务应用开发的时候,虽然和其他的项目需求大致差不多,但因为是另外的项目组进行维护,业务数据的需求与其他项目的需求有所差异,所以数据还是需要自己再重新开发一遍,确保项目满足用户的需求。
-
能力问题:数据的分析、处理和维护是一个相对独立的技术,需要由专业的人员来配合完成,但是很多时候,我们的应用开发人员比较多,而数据开发人员却相对短缺。
这三类问题都会导致应用开发团队变慢。这就是中台的关键——让前台开发团队的开发效率不受后台数据开发的影响。
在此我引用了中台战略书中对于数据中台的定义:
数据中台是基于大数据、云计算、人工智能的技术架构打造的数据化创新平台,支撑企业数字业务应用的标准化及快速定制化,实现数据驱动的精细化运营,沉淀企业的数据资产,为企业提供用户个性画像、商品智能推荐、业务在线监控等服务,解决企业业务在面向产业互联、生态发展过程中所遇到的应变与响应能力问题
------ 摘自 《中台战略》
数据中台是采用大数据、云计算、人工智能等前沿技术对跨域数据进行聚合和治理,并将数据抽象封装成服务,提供给前台应用,从而满足业务价值快速变化的需求。
02 数据中台逻辑架构
前面我们介绍了数据中台的定义后, 我们现在来看下数据中台的逻辑架构,了解数据中台在业务中是如何进行定位的。下图参照了ThoughtWorks的数据中台逻辑架构。
数据中台逻辑架构从上图数据中台的业务逻辑架构图中可以看到,数据API接口是数据中台的核心,它是连接前台和后台的桥梁,它向前台提供数据能力,通过 API 接口的方式向外提供数据服务,而不是直接把数据库给前台、让前台开发自行使用数据。至于如何产生数据 API接口 的过程?怎么快速提供更多的数据API接口?怎么提高数据API接口的数据质量,让数据更加清晰?怎么提升数据API接口的性能?这些是要围绕数据中台去构建的能力。后面的文章中将进一步进行讲解。