数据分析系列(一):了解数据指标的那些坑
前言
数据分析是互联网中的千古难题,每个人都会在简历上写自己具备数据分析的能力,但是这个能力究竟怎么衡量呢?个人认为,不是说我学会了SQL、Python这类看起来很高大的数据工具就可以,真正能利用数据分析,推动业务前进才是我们真正具备了数据分析的能力。
这个系列第一篇文章将围绕数据指标的重要性、了解数据指标的那些坑来切入,因为考虑到很多人进入一家公司也都是半路接手了别人的产品,所以很有可能已经有了一些数据指标体系,那么如何辨别这些数据指标,如何利用它来指导正确的业务选择才是我们所关心的话题。下一期我们再来聊聊如何搭建数据指标。
01 数据指标重要性
老板问:觉得我们新上线的游戏数据表现情况怎么样?
小A:还不错,每天新增也很多,日活也在涨。
老板皱了皱眉头,那同样的小B是这样回答的:
虽然目前来看日活数一直在增长,但是和渠道这边了解了下,我们的渠道素材转化率还是比较低的,目前给了我们头部推荐位置,但是素材点击人数和同类型游戏相比低了20%。所以我们需要更换渠道推广素材。
同时,我们目前的游戏次日留存能达到40%,ARPU=$0.01,是同类游戏里面比较高的标准;但是目前数据量不算太大,可以持续观察一下。
老板比较满意,让小B立即去安排美术制作渠道素材,同时每日同步留存及ARPU等数据情况给他。
后续3个月后,老板问:这款游戏我们需要继续推广吗?
小A:日活平稳,已经没有刚开始那么多新增用户了,至于要不要推广,我也拿不准。
老板皱了皱眉头,那同样的小B是这样回答的:
最近日活虽然上涨趋势不大,但是目前吸量程度而言,素材转化率提升了20%,目前已达到渠道标准;
留存角度来看,我们的次日留存能够稳定在35%,同时我们的30日留存能仍然维持在10%,说明用户对我们这款游戏还是比较认可的,如果不断每日导入新增流量,我们能很快突破100W DAU;
变现情况来看,我们综合的ARPU=$0.01,变现情况也是同类产品里拔尖的。
因此,我觉得我们可以大规模推广了。
老板同意小B的观点,让小B联系投放部门加大买量,同时和各个渠道沟通,开展深入联运模式。
站在老板的角度上,应该最害怕听到还不错,拿不准等,所以这里通过数据指标来证明观点非常重要。
02 要看一级指标
运营A和运营B在讨论一款以广告变现的休闲单机游戏。
运营A:发现这款游戏的留存很不错,ECPM能达到$3,我们可以多推广一下。
运营B:不行,你看它的广告ARPU很低,需要优化变现,不能继续推量。
那实际上为什么会导致这个情况出现呢?
运营B给运营A解释,这里可以看下面这个例子:
我们可以明显发现尽管产品A的ECPM能达到$3,但由于其广告展示率低,所以最终收入表现不如产品B。提高单一的ECPM有很多方法,有相关经验的人应该知道,比如我们可以在后台设置高底价,过滤一些低价值的广告,完全可以把ECPM达到一个高值,但是它没办法意味着我们变现能力的增强。
所以,这里需要强调的是:如果需要综合判断一个产品某方面能力的好坏,我们需要选取一些一级指标,而不能光看二三级指标。
03 数据统计指标口径不一致
事情还是发生在刚才场景下。
运营A:发现这款游戏的最近好像也没有做大版本更新,留存提升了几个点,为什么呢?
运营B:因为它们切换了数据统计方式,之前它们用的是自己的埋点系统,现在改成用Firebase统计了。
那这两个究竟有什么差距,运营B给运营A详细解释到:
Firebase是谷歌的三方统计平台,它对日活的定义是用户打开APP即算「活跃行为」,那么数据系统都是基于事件上报才能统计的,所以在无网环境下无法统计。但是基于Firebase的数据统计框架,用户第二天联网以后,会把昨天和今天的数据同时上报。而这款游戏之前使用的是自己的数据埋点形式,所以默认无网情况下,就不计算「活跃行为」。
举个例子来说,是如下情况(感兴趣的人可以看下这个部分)
如果以Friebase统计:
7月3日新增40个用户;
7月4日,20个「昨日新增用户」来玩这个游戏,其中10个用户在无网情况下打开了这个APP,7月4日统计的「次日留存率」暂且计入为10/40=25%;
7月5日,这10个用户又在有网情况下打开了这个游戏,7月4日的「昨日新增用户活跃人数」+10,7月5日「活跃人数」+10。那么7月5日的时候,你去看7月4日的「次日留存率」就会变为20/40=50%。
如果这款游戏之前使用的是自己的数据埋点形式统计,假定同样的情况:
7月3日新增40个用户;
7月4日,20个「昨日新增用户」来玩这个游戏,其中10个用户在无网情况下打开了这个APP,7月4日统计的「次日留存率」计入为10/40=25%;
7月5日,这10个用户又在有网情况下打开了这个游戏,7月5日「活跃人数」+10,但是7月4日不变,7月4日「次日留存率」仍等于25%。
那这两种计算方式哪种好?认为关注产品日活和留存的同学采取第一种方式即可,毕竟我们的出发点是看第一天新增用户第二天仍然愿意继续玩游戏的人能有多少(这里强调是单机游戏,不联网不影响游戏正常进行);但是关注商业化变现的同学则更建议第二种方式,用户不联网情况下,就不会展示广告,那这类用户其实就没有商业价值。如果利用第一种方式计算ARPU,哪一天突然涌入一批网络环境较差的用户,ARPU大幅度降低,其实也是正常现象,和商业化策略没有直接影响。
现实情况中,我们还会遇到很多类似的问题,不管你是利用三方数据平台还是自己的统计埋点,第一步,我们需要明确内部人员的指标统计口径保持一致,以免影响后续工作进展。
04 选取真正能够赋能业务的指标
其实很多人接受一个别人的业务最大的困惑点就是,现在的数据指标非常多,也很杂乱,我应该重点关注哪些呢?
《精益数据分析》这本书中,虚荣指标与可付诸行动的指标的概念,给出了如下定义:
虚荣指标:看上很美,感觉良好,但不能为公司带来丝毫改变。
可付诸行动的指标可以帮你遴选出一个行动方案,从而指导你的商业行为。
谈谈我对这个看法的理解,比如DAU这个问题,如果我现在是一个强依赖登陆的游戏产品(用户不登陆没办法玩,肯定也没办法付费),那我把DAU定义为用户打开APP,站在一个商业化运营的角度来说。有可能我今天1亿用户打开了这个APP,但最终登陆的人数只有1万,那其实我的产品所谓的DAU再高,也没有价值。这个所谓的DAU也不能帮助我做一些商业化决策,因为1亿用户和1万用户的可运营空间和策略是完全不一样的。
05 注意时间统一性
这个国内的运营同学不常容易遇到,但是出海企业需要特别关注的一个问题,需要保持你的各个数据后台都在同一个时区下,否则容易出现指标无法完全对齐的情况,你计算页面转化率等指标就会存在问题。
如果你运营的国家涉及到多个区域,可以使用主要国家的时区参考,也可以使用过去24小时的数据统计方式。
本期内容在这里结束,其实我也曾在运营A这个角色踩过很多坑。正如我提到的,正确的数据指标能够推动业务前进,相反如果是错误的业务数据指标,会起到反作用。所以,我觉得数据分析基础我们先学会如何看懂数据指标,至关重要。