机器学习与数据挖掘

"数据分析避坑指南"第一式

2021-06-20  本文已影响0人  数据氧气

数据分析师中有一种是业务分析师(也称商业分析师,BA),分析工作是既与数据打交道,又与业务场景打交道,那有好的工作习惯来可以帮助你省力许多。DO君根据经验整理出4大过程。

这篇分享的是第一个也是最重要的一个,分析的需求界定

场景1

业务A:“表哥,老板要个数据,帮我拉下,今天就要”

你吭哧一个小时把数据拉出来,过了一小时,又来了,“表哥,不好意思,口径有点问题,帮我过滤掉海外的数据”。

卧槽,为啥刚才不说好,再重头撸了一遍。

晚上七点半交付了数据后,准备下班,A又过来了,“表哥,抱歉,刚才定义的指标得到的数据不能反映实际情况,要改下”

你内心OS:“大爷的,我要吐血了,今天晚上又要加班了.......”

相信上述场景,对于很多数据分析师而言,是不是很熟悉?最主要的问题是数据分析中的需求界定环节出了问题,导致了大量的无用功,咱们就是这样变成了取数机器,工作没有价值。怎么改善这种局面呢?那么需要做好”需求界定”

01 分析"需求"知多少?

啥是分析类的需求?

为了特定的业务决策需求,通过量化的方法来获得辅助决策的数据(信息)

那么常见的需求类型有哪些呢?

* 前3个类型引用自专家Tom Davenport观点,他是巴布森学院(Babson College)的总统信息技术与管理学杰出教授。第4点是自己认为也是一类;

废话不多说,直接上案例。

案例1

目前景点预订详情页下方有个推荐的入口,老板让看下这个推荐模块订单转化效率如何?

判断分析类型,这是一个描述类分析需求,评价推荐效果的好坏;

02 “界定”怎么做?

那么下面如何界定呢?有个三步走的框架。强调的一点是一定要和相关方沟通需求,当场界定清楚

第一界定是确认清楚需求方的真正目的是什么。我不是业务的提数机,要帮助其解决一个业务决策问题;

第二界定的计算指标,确认清楚目前定义的指标是否是合适的,是否能准确的界定我们的问题;一开始的需求方定义的指标(单UV的订单转换效率)根据目的来判断并不合适。

第三界定的口径与数据来源确认,口径是涉及到样本的选择,避免出现样本量少,缺乏代表性,进而影响指标值得准确性。数据来源确认是输入源的信息是准确的。

03 避坑小提示

那么在界定过程中有几个注意点:

*拿到这个数后能干嘛?切分的维度,可以落地行动的维度?这个case中是根据模块来对计算指标进行切分。因为这个维度是由行动可以做的,否则不需要去拆此维度。如上面这个例子,是按照模块维度对指标进行拆分。

* 如果有第三方提供的数据,一定要确认数据来源,交叉确认无误。比如这个例子中产品经理提供的预订详情页的页面标识pageid是否有遗漏,可以用来源页到所有详情页的pageid及对应流量大小,采取这种遍历方式来帮助你交叉确认;

数据精确程度的成本是不一样的,数据越精确,成本越高。需求方的计算指标是否还有其它低成本实现方法,快速实现。

* 界定完之后,会议内容形成的需求说明书,以及分析预估完成时间,邮件发送给各相关方,主要是定下来项目范围与目标;

如果你是业务需求方,也要思考下,别脑门一热,让分析师帮我提个数。自己按照上面的需求界定思路先整理一遍,给到分析师的需求就相对清晰,合作愉快!

   

上一篇下一篇

猜你喜欢

热点阅读