大数据分析的四步过程模型
大数据这个词近些年非常火,其实在很多年前大家就开始利用大数据的一些方法和过程了。
耳熟能详的“决策支持系统”,“应急预案系统”,“舆情监测系统”等等,早在2005年前后就如雨后春笋般冒出来了。
我还记得当年参与了一个“舆情监测系统”的建设。
因为当时各个软件系统各自为政,所以甲方找了三四家一起来做这个系统。
其中包括了“基础信息采集”、“爬虫”、“展现”等。
我当时参与的部分就是将分析处理的结果在地图上进行展现,算是其中很小的一个模块。
最近听了Coursera的一个关于Data Analystics的课程,其中将大数据分析的过程分成四个步骤。
而翻阅了一些相关的书籍和资料发现不论是《大数据分析》的6步过程模型,还是其他文章提到的5个阶段,归纳起来都是这四个步骤。
因为Coursera上介绍的这四个步骤更加清晰,所以今天和大家分享的也是四个步骤的版本。
1 发现
从应用目标出发,确定所需的数据。
这里面包括定义问题,找出干系人的期望和顾虑;提出假设“可能会发生什么事情?”;收集数据并进行一些处理和分析。
问题的定义非常重要。
我们都知道,如果方向错了,那么做得再多不仅会事倍功半,甚至会产生负面的效果。
一家公司一直在委派一些专业机构进行招聘、绩效评估等方面的工作。
但是一直合作的专业机构的熟悉环境的接口人员岗位变动了,新来的人员对这个公司的很多东西不熟悉,造成了最近几个月的招聘工作进展不顺利。
有人会觉得这个问题就是提供人力资源服务的公司的问题。
但是这个是真正的问题吗?
会不会是公司一直没有能够开发自己的人力资源管理能力,这才是真正的问题呢?
以前在做决策支持相关功能和系统的时候,发现很多时候用户描述的问题都是表象。
大部分会集中在沟通效率低,工作效率低,成本不断上升。
但是根本的问题到底在哪里?
这是需要我们去进行挖掘的,不能简单的把用户给你的信息当做金科玉律。
因为很多时候用户也不知道根本的问题是什么。
立场不同,角度不同,对问题的描述都会不同。
2 分析
对数据进行处理和建模,看看这些数据如何来支撑之前的假设。
我们经常听说的自我学习体系,也是在这个过程中建立的。
在《大数据分析》以及其他一些书籍中,对于这个部分会讲述的比较详细。
包括算法、建模、模型优化和分析等等。
3 解释
根据上一步的分析结果对过去进行解释,并对未来进行预测。
将分析结果与一些财务、运营指标进行关联,用以支撑决策。
对于下一步的行动给出建议和评价。
这个步骤其实挺有意思的。
要知道同一份数据,可以根据不同的目的有不同的解释。
桌子上放了半杯水,你可以说,只剩下半杯就没有了。
你也可以说,看,桌子上还有半杯水呢!
数据是死的,就看你怎么看,怎么用了。
所以说,不管是大数据还是小数据,对于决策都是辅助的。
真正做解释和决策的其实还是人。
4 输出
根据解释和建议,制定详细的步骤或者路线图,并且提交给相关关系人。
对照业务目标,跟踪实施的效果。
以上介绍了关于大数据分析的四个步骤,不知道作为大数据产品经理的小伙伴有什么相关信息可以分享下~
小婧是一名行走在实践路上的资深业务分析师(BA),如果想与我同行,就请关注我吧!