数据分析思维
数据分析思维,是分析思维的引申应用。再优秀的思考方式,都需要佐证和证明,数据就是派这个用处的。如果分析思维是一种结构化的体现,那么数据分析思维在它的基础上再加一个准则:「不是我觉得,而是数据证明」。
数据分析思维也是面试中经常会被问到的。在面试中我经常会被问到“你认为数据分析过程中最难的地方是什么?”这其实就是在考察你的数据分析思维。因为最难的地方其实是对业务逻辑的理解,理解了业务逻辑你才有分析的思路,才知道该怎么去分析,而这一切只有自己真正做过项目才能够有真实的感受。
在早期,新人最好选择一到两个领域深入了解其业务,然后以此拓展边界
一、分析框架
分析也是有框架和方法论的,主要围绕三个要点展开:
一个业务没有指标,则不能增长和分析;
好的指标应该是比率或比例;
好的分析应该对比或关联。
举一个例子:我告诉你一家超市今天有1000人的客流量,你会怎么分析?
这1000人的数量,和附近其他超市比是多是少?(对比)
这1000人的数量比昨天多还是少?(对比)
1000人有多少产生了实际购买?(转化比例)
路过超市,超市外的人流是多少?(转化比例)
这是一个快速搭建分析框架的方法。如果只看1000人,是看不出分析不出任何结果。
二、数据思维的框架
如果你不能用指标描述业务,那么你就无法有效增长它。
每一位数据分析师都要有指标体系的概念,报表也好,BI也好,即使机器学习,也是围绕指标体系建立的。
下图就是一个典型的指标体系,描述了用户从关注产品、下载、乃至最后离开的整个环节。每一个环节,都有数据及指标以查询监控。
不同业务背景需要的指标体系不同,但有几个建立指标的通用准则。
好指标与坏指标
好指标应该是核心驱动指标。虽然指标很重要,但是有些指标需要更重要。就像销量和利润,用户数和活跃用户数,后者都比前者重要。
核心指标不只是写在周报的数字,而是整个运营团队、产品团队乃至研发团队都统一努力的目标。
记住是一个阶段,不同时期的核心驱动指标不一样。不同业务的核心驱动指标也不一样。
互联网公司常见的核心指标是用户数和活跃率,用户数代表市场的体量和占有,活跃率代表产品的健康度,但这是发展阶段的核心指标。在产品1.0期间,我们应把注意力放到打磨产品上,在大推广前提高产品质量,这时留存率是一个核心指标。而在有一定用户基数的产品后期,商业化比活跃重要,我们会关注钱相关的指标,比如广告点击率、利润率等。
好的指标还有一个特性,它应该是比率或者比例。
拿活跃用户数说明就懂了,我们活跃用户有10万,这能说明什么呢?这说明不了什么。如果产品本身有千万级别的注册用户,那么10万用户说明非常不健康,产品在衰退期。如果产品只拥有四五十万用户,那么说明产品的粘性很高。
坏指标有哪些呢?
其一是虚荣指标,它没有任何的实际意义。
产品在应用商店有几十万的曝光量,有意义吗?没有,我需要的是实际下载。下载了意义大吗?也不大,我希望用户注册成功。曝光量和下载量都是虚荣指标,只是虚荣程度不一样。
第二个坏指标是后验性指标,它往往只能反应已经发生的事情。
活动运营的ROI(投资回报率)也是后验性指标,一个活动付出成本后才能知道其收益。可是成本已经支出,活动的好与坏也注定了。活动周期长,还能有调整余地。活动短期的话,这指标只能用作复盘,但不能驱动业务。
第三个坏指标是复杂性指标,它将数据分析陷于一堆指标造成的陷阱中。
指标能细分和拆解,比如活跃率可以细分成日活跃率、周活跃率、月活跃率、老用户活跃率等。数据分析应该根据具体的情况选择指标,如果是天气类工具,可以选择日活跃率,如果是社交APP,可以选择周活跃率,更低频的产品则是月活跃率。
指标结构
指标也有固有结构,呈现树状。指标结构的构建核心是以业务流程为思路,以结构为导向。
我们把金字塔思维转换一下,就成了数据分析方法了。
从内容运营的流程开始,它是:内容收集—内容编辑发布—用户浏览—用户点击—用户阅读—用户评论或转发—继续下一篇浏览。
这是一个标准的流程,每个流程都有指标可以建立。内容收集可以建立热点指数,看哪一篇内容比较火。用户浏览用户点击则是标准的PV和UV统计,用户阅读是阅读时长。
当你有了指标,可以着手进行分析,数据分析大体可以分三类,第一类是利用维度分析数据,第二类是使用统计学知识如数据分布假设检验,最后一类是使用机器学习。我们先了解一下维度分析法。
维度是描述对象的参数,在具体分析中,我们可以把它认为是分析事物的角度。销量是一种角度、活跃率是一种角度,时间也是一种角度,所以它们都能算维度。
数据模型不是一个高深的概念,它就是一个数据立方体。
上图就是三个维度组成的数据模型/数据立方体。分别是产品类型、时间、地区。我们既能获得电子产品在上海地区的2010二季度的销量,也能知道书籍在江苏地区的2010一季度销量。
数据模型将复杂的数据以结构化的形式有序的组织起来。我们之前谈到的指标,都可以作为维度使用。下面是范例:
上图就是三个维度组成的数据模型/数据立方体。分别是产品类型、时间、地区。我们既能获得电子产品在上海地区的2010二季度的销量,也能知道书籍在江苏地区的2010一季度销量。
数据模型将复杂的数据以结构化的形式有序的组织起来。我们之前谈到的指标,都可以作为维度使用。下面是范例:
将用户类型、活跃度、时间三个维度组合,观察不同用户群体在产品上的使用情况,是否A群体使用的时长更明显?
将商品类型、订单金额、地区三个维度组合,观察不同地区的不同商品是否存在销量差异?
数据模型可以从不同的角度和层面来观察数据,这样提高了分析的灵活性,满足不同的分析需求、这个过程叫做OLAP(联机分析处理)
数据模型还有几种常见的技巧、叫做钻取、上卷、切片。
选取就是将维度继续细分。比如浙江省细分成杭州市、温州市、宁波市等,2010年一季度变成1月、2月、3月。上卷则是钻取的相反概念,将维度聚合,比如浙江、上海、江苏聚合成浙江沪维度。切片是选中特定的维度,比如只选上海维度、或者只选2010年一季度维度。
谈到维度法,想要强调的是分析的核心思维之一:对比,不同维度的对比,这大概是对新人快速提高的最佳捷径之一。比如过去和现在的时间趋势对比,比如不同地区维度的对比,比如产品类型的区别对比,比如不同用户的群体对比。单一的数据没有分析意义,只有多个数据组合才能发挥出数据的最大价值。
我想要分析公司的利润,利润 = 销售额 – 成本。那么找出销售额涉及的指标/维度,比如产品类型、地区、用户群体等,通过不断的组合和拆解,找出有问题或者表现良好的原因。成本也是同理。
这就是正确的数据分析思维。总结一下吧:我们通过业务建立和筛选出指标,将指标作为维度,利用维度进行分析。
很多人会问,指标和维度有什么区别?
维度是说明和观察事物的角度,指标是衡量数据的标准。维度是一个更大的范围,不只是数据,比如时间维度和城市维度,我们就无法用指标表示,而指标(留存率、跳出率、浏览时间等)却可以成为维度。通俗理解:维度>指标。
分析若只是当一份报告呈现上去,后续没有任何跟进、改进的措施,那么数据分析等与零。
业务指导数据,数据驱动业务。这才是不二法门。
三、训练方法
以生活中的问题出发做练习。
这家商场的人流量是多少?怎么预估?
上海地区的共享单车投放量是多少?怎么预估?
街边口的水果店,每天的销量和利润是多少?怎么预估?
这些开放性问题起源于咨询公司的训练方法,通过不断地练习,肯定能有效提高分析思维。另外就是刷各种CaseBook。
四、通用的互联网业务模型
产品运营模型:以移动端APP为主体,以经典的AAARR框架学习,了解活跃留存的指标和概念,包括Acquisition用户获取、Activation用户活跃、Retention用户留存、Revenue营收、Refer传播,以及细分指标。
市场营销模型:以传统的市场营销方法论为基底,围绕用户的生命周期建立框架。包括用户生命周期,生命周期价值、用户忠诚指数、用户流失指数、用户RFM价值等。
流量模型:从早期的网站分析发展而来,以互联网的流量为核心。包括浏览量曝光率、病毒传播周期、用户分享率、停留时间、退出率跳出率等。
电商和消费模型:以商品的交易、零售、购买搭建而起。包括GMV、客单价、复购率、回购率、退货率、购物篮大小、进销存,也包含SKU、SPU等商品概念。
用户行为模型:通过用户在产品功能上的使用,获得精细的人群维度,以此作为分析模型。包括用户偏好、用户兴趣、用户响应率、用户画像、用户分层,还包含点赞评论浏览收藏等功能的相关指标。
五、产品运营模型 :AARRR模型
获取(Acquisition):用户如何发现(并来到)你的产品?
激活(Activation):用户的第一次使用体验如何?
留存(Retention):用户是否还会回到产品(重复使用)?
收入(Retention):产品怎样(通过用户)赚钱?
传播(Retention):用户是否愿意告诉其他用户?
获取部分一般需要评估的维度有:渠道的获客数量、获客质量等 。渠道数量和质量的指标有很多,要依据产品及公司业务模块区分制定,一般有:每日新增、累积新增、启动次数、首次交易户、首绑交易户、一次性用户数、平均使用时长等。
激活一般指注册激活、主动活跃、推送活跃、交易活跃等。例如显示这个APP的交易活跃明显大于主动活跃,那么可以推断这个APP是交易驱动,可能是一个电商或者理财类的APP。对于一些新闻、娱乐、社交类的APP,它们的主动活跃一般会高于交易活跃。
这里要特别说明的是注册激活部分。注册激活部分需要进行详细的页面埋点,列出影响注册激活的因素,对这些元素不断优化,最后提高产品的注册激活数量。
留存部分,一般,次日留存>3日留存>7日留存>次月留存。用户的留存量刚开始会下降的比较严重,到了后期会逐渐稳定在一个数量级上。稳定下来的这些用户,基本上就是产品的目标用户了。
留存还有很多指标,如:次日留存、3日留存、每日流失、每日回流、用户声明周期、平均生命周期贡献、7日回访用户、使用间隔、页面访问量、回访率等等。具体选定哪个维度进行统计要依据自己的产品和业务重新定制。
收入部分主要是公司的业务层面的数据,用户使用APP后,浏览了什么样的商品和服务,选了了什么商品和服务,最后支付了多少。关于固体交易金额的数据,第三方工具一般统计不了,公司也不可能把这部分数据接口开放给第三方,所以这块是需要我们在产品后台单独做埋点的。
整个支付环节的埋点一般有两个主要因素要考虑,一是看用户的支付支付体验是否顺畅,是否有一些页面卡主了用户,让用户无法进行交易。二是看在哪一个页面流失最高,用控制变量的方法调整流失率高的页面的栏位、交互等。
传播部分一般可以分成两个维度,舆情监控维度(包括用户的主动传播分享)和产品的引导分享维度。
大一点的公司一般都有专业的部门来负责舆情监控,会收集和处理一些负面的评论,积极传播产品的正面价值。
产品内部的引导分享可以参照上面的表格制定一些监控因素,最后统计数据,指导下一步工作。
注:埋点
做埋点的时候, 一般要做两张表格,一张是埋点事件表,一张是埋点统计表。
数据埋点事件表包括页面、事件名称、备注。一般是记录每个页面的交互事件,一般是后台记录次数。比如点击登录按钮的次数、点击获取验证码的次数,进入某个页面的次数、退出某个页面的次数等。
埋点统计表包括具体的模块,业务说明,备注。
六、用户生命周期模型
用户的生命周期,简单来说就是:用户从开始接触产品到离开产品的整个过程。
搭建用户生命周期模型的一般步骤如下:
业务逻辑梳理;
找到影响用户留存/消费的关键功能;
定义各阶段用户行为。
通用用户行为定义模板:
各个时期目标以及策略:
引入期:运营目标——获客;运营策略——优化渠道、提高注册转化率和下单转化率
成长期:运营目标——提升用户价值、引导用户多次购买,培养用户使用习惯;运营策略——抓住用户每一次需求窗口促进购买,提升用户购买次数,客诉及时安抚
成熟期:运营目标——维持忠诚度、促进传播;运营策略——促进N购、交叉营销、老用户关怀、鼓励传播
休眠期:运营目标——降低流失;运营策略——流失分析、流失预警、潜在流失用户召回
流失期:运营目标——召回用户;运营策略——流失召回、产品诊断与重新定位
注:贯穿各个生命周期的问卷调查
用户问卷调查是获取用户真实需求的有效手段,《增长黑客》中介绍的很多优化产品功能与运营策略,从而实现用户爆发式增长的例子,都始于用户调研。
问卷调查贯穿用户生命周期的各阶段,主要的调研节点有:
用户生命周期价值 :
生命周期价值是用户在生命周期内能为企业提供多少收益,它需要涉及财务定义。互联网行业更多提到生命周期,而不是生命周期价值,因为互联网的商业模式没有传统营销的买和卖那么简单明确。 举个例子,微信用户的生命周期价值能否计算?并不能,不论是广点通、游戏或者微信理财,都推导不出一个泛化的模型。但是部分产品,如金融和电商,生命周期价值是可计算的。 以互联网金融举例,某App提供理财和现金贷款两种业务,公司从这两个业务中获得收入通常是一个较稳固的比率,而成本支出平摊每个用户头上也是固定常数。所以利润就变成了用户理财和贷款的金额大小,以及生命周期的长短。这两者都是可估算的。 生命周期价值比生命周期重要,因为公司要活下去,就得赚更多的钱,而不是用户使用时间的长短
七、 回访用户、流失用户和流失预警
回访用户:用户流失后,再次访问的用户。
用户回访率=回访用户(再次访问的已流失用户)÷所有已流失用户×100%
对于用户流失时间,我们有一个一般定义:用户回访率在5%-10%区间,这个区间对应的时间点及之后的时间,我们认为用户已经流失。
例如:
如果我们设定的流失期限较短,流失回访用户则较多,流失回访率也就较高。随着流失期限的延长,流失回访率呈单调下降趋势:在拐点处,用户回访率为5%,这个拐点对应的流失期限是10月,在10个月之后的用户回访率均低于5%。所以,我们认为,这款产品的用户流失时间,可以选择在用户停止发生XX行为10个月后,该用户即为流失用户。
注意:
回访用户不仅仅是回来打开App的用户,要根据具体产品属性进行判断。对于理财类产品,回访用户指的是投资;对于工具类产品,回访用户指的是登录;对于社交类产品,回访用户指的是互动;针对内容型产品,回访用户指的是访问。
分析流失预兆:
针对已流失用户进行研究分析,找出他们流失前的共同点,如果当前的活跃用户在未来某一天出现已流失用户的相似征兆,则需要触发流失预警机制。
分析流失预兆步骤如下:
确定流失用户,分析用户流失前的行为;
假设用户流失的影响因素;
通过访谈,明确用户流失的行为路径。
分析流失用户流失前的行为,一般可以从以下几个方向进行数据分析:
用户流失前发生了哪些相似的行为;
用户是否集中在某一渠道;
用户属性是否一致;
流失前,产品、运营、市场是否发生某些变动。
注意:分析流失前的用户行为,我们只需要分析用户导入期、成长期、成熟期的数据。
设计预警机制:
根据上述得到的何为流失用户,以及流失用户在流失前的行为,我们就可以开始设计预警机制了。
分等级实现,根据流失前用户的行为指标,分别对这些指标赋予相应的权重,根据这些指标、权重进行计算,当数值高于XX值时,系统定义该用户具有流失风险,要么自动触发、要么将名单传输到运营手里,运营人工召回。
流失用户召回策略,用户进入休眠期或流失期后,我们可以采取以下几种方法来召回用户:
优惠刺激:使用租车平台进行租车的用户大多是价格敏感型用户,我们可以通过加大优惠力度来召回用户。对于在平台留下较多行为数据的用户,我们可以推送个性化优惠来提高召回成功率。提醒用户有未使用的优惠和会员权益,对于账户中尚有未使用的优惠券或会员权益的用户,我们可以对其进行“尚有未使用优惠”的提醒。
游戏化唤醒:邀请用户参与平台游戏(如抽奖),以游戏化的方式给用户新鲜感,提升用户的活跃度。
情感化唤醒:再现用户在平台上完成的旅程,并发送声情并茂的召回邮件。
客户/用户忠诚指数
忠诚指数是对活跃留存的再量化。活跃仅是产品的使用与否,A用户和B用户都是天天打开App,但是B产生了消费,那么B比A更忠诚。数据往往需要更商业的指标描述用户,消费与否就是一个好维度。
客户/用户流失指数
流失指数是对流失的再量化,它是忠诚指数的反面。流失率衡量的是全体用户,而为了区分不同用户的精细差异,需要流失指数。在早期,流失指数=1-忠诚指数。
流失指数和忠诚指数的具体定义能根据业务需要调整,比如忠诚按是否消费,流失按是否打开活跃,只要解释能站住脚。
在拥有足够的行为数据后,可以用回归预测流失的概率,输出[0,1]之间的数值,此时流失的概率便是流失指数。
八、用户分群模型:RFM模型
客户/用户价值指数
用户价值指数是衡量历史到当前用户贡献的收益(生命周期价值是整个周期,包括未来),它是精细化运营的前提,不同价值的用户采取不同策略以最大化效果。用户价值指数的主流计算方式有RMF模型,利用R最近一次消费时间,M总消费金额,F消费频次,将用户划分成多个群体。不同群体即代表了不同的价值指数。
RFM模型是衡量客户价值和客户创利能力的重要工具和手段。该机械模型通过一个客户的近期购买行为(Recency)、购买的总体频率(Frequency)以及花了多少钱(Monetary)三项指标来描述该客户的价值状况。体现了分类思维。
在R/M/F三个指标上,我们通过经验将实际的用户划分为以下8个区(如上图),我们需要做的就是促进不同的用户向更有价值的区域转移。也就是将每个付费用户根据消费行为数据,匹配到不同的用户价值群体中,然后根据不同付费用户群体的价值采用不同的策略。
九、多渠道归因问题的三种类型
十、流量模型
浏览量:PV,即页面访问量或点击量,用户每1次对网站中的每个网页访问均被记录1次。用户对同一页面的多次访问,访问量累计。
渠道到达量:俗称曝光量,即产品推广页中有多少用户浏览。它可以在应用商店,可以在朋友圈,可以在搜索引擎,只要有流量的地方,都会有渠道曝光。曝光量是一个蛮虚荣的数字,想一想现代人,每天要接触多少信息?其中蕴含了多少推广,最后能有几个吸引到用户?更多时候,渠道到达量和营销推广费挂钩,却和效果相差甚远。
渠道ROI:ROI是一个广泛适用的指标,即投资回报比。
市场营销、运营活动,都是企业获利为出发点,通过利润/投资量化目标。利润的计算涉及财务,很多时候用更简单的收入作分子。当运营活动的ROI大于1,说明这个活动是成功的,能赚钱。
PV(PageView)是页面浏览量,用户在网页的一次访问请求可以看作一个PV,用户看了十个网页,则PV为10。
UV(Unique Visitor)是一定时间内访问网页的人数,正式名称独立访客数。在同一天内,不管用户访问了多少网页,他都只算一个独立访客。
用户访问时长:是一次会话持续的时间。不同产品类型的访问时长不等,社交肯定长于工具类产品,内容平台肯定长于金融理财,如果分析师发现做内容的产品大部分用户访问时长只有几十秒,那么最好分析一下原因。
退出率:是网页端的一个指标。网页端追求访问深度,用户在一次会话中浏览多少页面,当用户关闭网页时,可认为用户没有「留存」住。退出率公式:从该页退出的页面访问数/进入该页的页面访问数,某商品页进入PV1000,该页直接关闭的访问数有300,则退出率30%。
跳出率是退出率的特殊形式,有且仅浏览一个页面就退出的次数/访问次数,仅浏览一个页面意味着这是用户进入网站的第一个页面,俗称落地页LandingPage。
退出率用于网页结构优化,内容优化。跳出率常用于推广和运营活动的分析,两者容易混淆。
K因子:每位用户平均向多少用户发出邀请,发出的邀请又有多少有效的转化率,即每一个用户能够带来几个新用户,当K因子大于一时,每位用户能至少能带来一个新用户,用户量会像滚雪球般变大,最终达成自传播。当K因子足够大时,就是快口相传的病毒营销。
国内的邀请传播,主体自然是微信朋友圈。微信分享功能和网页都是能增加参数统计的,不难量化。
病毒传播周期:活动、广告、营销等任何能称之为传播的形式都会有传播周期。病毒性营销强则强矣,除非有后续,它的波峰往往只持续两三天。这也是拉新的黄金周期。
另外一种传播周期是围绕产品的邀请机制,它指种子用户经过一定周期所能邀请的用户。因为大部分用户在邀请完后均会失去再邀请的动力,那么传播周期能大大简化成如下:假设1000位种子用户在10天邀请了1500位用户,那么传播周期为10天,K因子为1.5,这1500位用户在未来的10天内将再邀请2250位用户。
理论上,通过K因子和传播周期,能预测依赖传播带来的用户量,可实际的操作意义不大,它们更多用于各类活动和运营报告的解读分析。
用户分享率:现在产品都会内嵌分享功能,对内容型平台或者依赖传播的产品,分享率是较为重要的指标,它又可以细分为微信好友/群,微信朋友圈,微博等渠道。
有一点值得注意,数据只能知道用户转发与否,转发给谁是无法跟踪的。所以产品用物质激励用户分享要当心被薅羊毛。反正我转发都是给「文件传输助手」的…
活动曝光量/浏览量:传播和线上活动是息息相关的,这两者的差异不大。想要做好一个活动,单纯知道活动的浏览量是不够的,好的活动一定是数据分析出来的。
十一、电商和消费模型
GMV:Gross Merchandise Volume,是成交总额(一定时间段内)的意思。
在电商网站定义里面是网站成交金额。这个实际指的是拍下订单金额, 包含付款和未付款的部分。GMV指标不是实际的交易数据,但具有一定的参考价值。比如,实际支付占比的大小,可以切实反映买家的购买行为和退单比例,并可进一步研究出顾客的购买意向以及市场整体交易情况。GMV数值可能远远超过实际成交金额.
对于资本市场而言,电商平台企业的快速增长远比短期的利润更加重要,GMV正是衡量电商企业增速的最核心指标。
客单价:传统行业,客单价是一位消费者每一次到场消费的平均金额。在互联网中,则是每一笔用户订单的收入,总收入/订单数。
很多游戏或直播平台,并不关注客单价,因为行业的特性它们更关注一位用户带来的直接价值。超市购物,用户购买是长周期性的,客单价可以用于调整超市的经营策略,而游戏这类行业,用户流失率极高,运营人员更关注用户平均付费,这便是ARPU指标,总收入/用户数。
ARPU可以再一步细分,当普通用户占比太多,往往还会采用每付费用户平均收入ARPPU,总收入/收费用户数。
复购率:若把复购率说成营收届的留存率,你就会知道它有多重要了。和新增用户一样,获得一个新付费用户的成本已经高于维护熟客的成本。
在不少分析场景中,会将首单用户单独拎出来作为一个标签,将两次消费以上的用户作为老客,之所以这样做,是从一到二的意义远不止加一那么简单。
用户第一次消费,可能是体验产品,可能是优惠,可能也是运营极大力地推动,各类因素促成了首单。而他们的第二次消费占比会有断崖式下跌(对应次日留存率的下跌),因为这时候的消费逐渐取决于用户对产品的信任,模式的喜欢或者习惯开始养成。
很多时候,用户决策越长往往意味着客单价越高,如投资,旅游。此时首单复购率越是一个需要关注的指标,它意味着更多的利润。
复购率更多用在整体的重复购买次数统计:单位时间内,消费两次以上的用户数占购买总用户数。
回购率是另外一个指标,值得是上一个时间窗口内的交易用户,在下一个时间窗口内仍旧消费的比率。例如某电商4月的消费用户数1000,其中600位在5月继续消费,则回购率为60%。600位中有300位消费了两次以上,则复购率是50%。
退货率:退货率是一个风险指标,越低的退货率一定越好,它不仅直接反应财务水平的好坏,也关系用户体验和用户关系的维护。
购物篮分析:购物篮分析不应限于电子商务分析,而是用户消费行为分析。
连带率是购物篮分析的一种指标,特指销售件数和交易次数之比。在大型商场和购物中心中,连带消费是经营的中心,用户多次消费即连带消费。在电商中是购物的深度,是单次消费提高利润的前提。
商品热度是一种快速见效的分析。可以将商品分为最热门Top20,最盈利Top20等,它依托二八法则,找出利润的抓手,很多营销会将它和连带率结合,像电子商务,重点推广多个能带来流量的热门爆款,爆款并不赚钱,而是靠爆款连带销售其他有利润的商品。这种流量商品连带利润商品的策略并不少见。
购物篮分析中最知名的想必是关联度,简单理解是,买了某类商品的用户更有可能买哪些其他东西。啤酒与尿布大概是最知名的案例了,虽然它是错的,但揭示了商品之间确实存在关联。
关联分析有两个核心指标,置信度和支持度。支持度表示某商品A和某商品B同时在购物篮中的比例,置信度表示买了商品A和人有多少同时买了B,表示为A→B。老王每次去菜场买菜都喜欢买一把葱,在老王的菜篮(购物篮)分析中,葱和其他菜的支持度很高,可是能说明老王买葱后就一定买其他菜(葱→其他菜)么?不能,只能说老王买了菜会去买葱(其他菜→葱)。除此还有提升度。 最有名的是Apriori算法。
关联分析并非只适用于购物篮,在很多营销场景中都会用它作为追加销售和交叉销售。常见有大额消费+现金贷,医疗健康+保险等,目的便是提高营收。
一、麦肯锡思维
金字塔原理
麦肯锡思维中很重要的一条原理叫做金字塔原理,它的核心是层次化思考、逻辑化思考、结构化思考。
什么是金字塔?任何一件事情都有一个中心论点,中心论点可以划分成3~7个分论点,分论点又可以由3~7个论据支撑。层层拓展,这个结构由上至下呈金字塔状。
看一下运营中典型的金字塔思维:
我们活跃用户数在下降(中心论点),主要原因是竞争加剧(分论点),其次原因是新用户减少(分论点),老用户流失加快(分论点)。其中竞争加剧是因为竞争对手ABC出现(论据),新用户减少是ASO排名下降(论据)和渠道投入疲软(论据)造成,老用户流失是因为产品欠佳(论据)。我建议……
这是合格运营的结构化思考。
结构化思考我建议利用纸或思维导图工具画出来。我说过,人是依赖经验思考的,擅长的是线性思维:因为-所以-最终,不擅长深度的结构思考。思维导图是一个非常好的工具,擅加利用,已经完成一半。例如《金字塔原理》书的思维导图:
结构化可以是三层,也可以拓展更多的分论点和层数。这一点大家想成我国语文教育中经典不衰的议论文作文模板:总-分-总结构(为什么作文要这样写,因为思路清晰,方便语文老师快速阅卷,用在思考是一样的道理)。金字塔思维则是总-分-再分。
金字塔原理有一个核心法则MECE,读作MeSee,全称Mutually Exclusive Collectively Exhaustive,中文意思是相互独立,完全穷尽。它指导我们如何搭建结构。
相互独立,说的是每个分论点彼此应该没有冲突和耦合,都属于独立的模块。完全穷尽,则是所有的分论点都被提出,不会有遗漏。这一点看上去容易,其实很难做到。
回到我们活跃数下降的例子,它提出了竞争加剧、新用户减少、老用户流失三个分论点。竞争加剧,竞争对手涌入,本来就意味着竞争对手会掠夺你的新用户,而ASO排名是非零和博弈,竞争对手上升你的排名就会下降,也造成新用户减少。两个分论点并不完全独立,违反了MECE法则。那么应该怎么分?
1.竞争对手出现:
竞争导致ASO排名下降
竞争对手掠夺了新用户
2.新增渠道疲软:
投入减少
3.老用户流失:
产品欠佳
如何划分分论点,我们可以用事物间的不同特性划分,它本质上也是一个分类问题,目的是找出事物(论点)之间的共性。
比如活跃下降可以从新老用户展开、可以从产品不同模块分析等等。分析思路不同,则分论点不同,核心依旧遵循MECE法则。当然很多分析结构已经有前人总结,属于套路,诸如运营的核心拉新促活留存。
结构强调的是穷尽,也就是越多越好,而随着分论点的增加,结构会更加复杂,不便于梳理和总结,所以分论点需要强调在3~7之间。
实际上我们很难真正做到穷尽,因为不了解的因素、隐藏的关键、信息不对称、经验等局限都会阻碍思维,做不到穷尽。如何找出尽可能多的分论点?这里列举我的心得,这不是麦肯锡方法。
你首先要找到一个万能公式。
绝大多数的商业项目、数据分析、业务讨论,都可以抽象成公式:
利润 = 销售额 - 成本;
销售额 = 购买人数 * 转化率 * 客单价;
购买人数 = 地区A购买人数+地区B购买人数+……
地区A购买人数 = 地区A新用户 + 地区A老用户;
此类公式均为小学难度,可很多分析项目就是能用公式化的思维和套路概括。因为项目本身是由三到四个核心因素决定,只要找到核心因素,就能将其组合。
接下来举一个具体问题:企业利润下降了,是什么原因?我们就能用公式分解出分论点。
是销售额下降了?还是成本上升?
如果是销售额下降,那么是购买人数少了?是客单价下降了?还是购买转化率降低?
以此类推,则能形成结构化的分析思路。
公式是一种思维框架,是一种经验导向的方法论,将你过去的经验总结和抽象,得到高度概括的因素。像利润这种都是再简单不过的商业理论,熟悉后就能快速使用。很多分析思维,在多年总结下,已经有成熟的解决方案。遇到问题,别急着画思维导图,不如先问问前辈和大牛们。经验会阻碍我们,经验也能帮助我们。
互联网行业的分析有点特殊,因为互联网的不确定性增加了。除了技术发展日新月异,用户需求不断改变,很多运营玩法也常常翻新。早几年标题党火爆,现在则注重内容价值的回归,曾经运营的核心是用户数,现在则是商业变现。这种快速变化导致分析思维也要有快速响应、学习和调整的能力。这方面,对互联网的分析是一种挑战。
对新人而言,很难一开始就掌握万能公式,但在具体的工作过程中,需要有意识的总结和提炼。另外分析中会有非量化的因素,比如团队士气、管理风格、员工忠诚度等。这是公式无法解决的缺点。
MECE是思考活动的技术和艺术,首先得有一个思考作为开始。这是什么意思?因为金字塔是从上而下,需要有一个中心论点,也就是塔尖。
什么是假设先行?就是以假设作为思考的起点。我不需要做全局的思考,而是先问出一个问题,然后思考解决它:我这款产品的特点在A功能吗?这款产品对用户们很有吸引力吗?我的活动如何在朋友圈引发传播?怎么让用户在活动中更爽?
在做出假设后,引导思维去挖掘分论点,然后分析。比如我希望活动传播,我要考虑哪些人会传播,他们是因为利益引诱还是情感触动?传播的过程应该什么样,方便还是复杂?这样的分析思维,比堪堪想一个空中楼阁的完美方案靠谱多了。
不管问题形式是如何、是否还是能不能,只要作出了假设,就能用MECE原则画出金字塔结构。不要想着从无尽的业务和数据中找出规律,这叫大海捞针。这种根据问题作为中心论点形成的结构化思维,叫做问题树/逻辑树 Issue Tree。
假设抽丝剥茧后的每一个论据都应该能用是或否回答。分析思维和数据分析不一样,数据分析追求数据的精确度,而分析思维不需要,只要能回答问题,是和否足够了。
假设会被否定或者拒绝,我认为产品对用户有吸引力,但是最后所有的论据,包括留存率、用户使用时长、功能使用率、用户评价都是否定,那么吸引力也就不成立,此时应该修改假设:产品的某一方面有问题,然后继续画新的问题树。
不要害怕修正错误的假设,不要寻找事实强撑错误的假设。
接下来谈剪枝。MECE虽然能画出详尽的结构,但不意味着我们要全部分析。维基百科案例中的IssueTree,有些分论点层层展开,有些分论点就嘎然而止。很多论点我们没有深入必要,需要对这部分论点论据舍弃,目的是找出关键驱动因素。
企业利润的关键驱动因素是利润和成本,用户吸引力的关键驱动因素是留存率。利润和成本还能再找出其中的细分关键因素,留存率也一样。这才是我们要的。
一旦找到关键驱动因素,可以基于此展开数据调研、取证、分析和结论,而不是对所有问题树开展。为什么需要围绕关键驱动因素?这里有一个新的核心法则,大名鼎鼎。
二八法则!
现在我们来理一下分析思维的思路:
提出假设—MECE原则(万能公式)—结构化分析—找出关键驱动因素—数据分析
二、了解SMART、5W2H、SWOT、4P理论、六顶思考帽等框架
七、波士顿矩阵
在传统以营销为主导的企业中,不论是日用品消费还是生产制造加工,企业一定有一系列的产品。波士顿矩阵认为,产品战略管理可以从两个角度衡量:市场增长率和相对市场占有率。
市场增长率是包括企业销售额、竞争对手强弱及利润高低的综合指标。而相对市场占有率则代表了企业在市场上的竞争实力。
这两个都是可量化的指标,将它们分别作X轴和Y轴,则能划分出四个象限。
数据分析思维在产品管理中,我们把高增长率-高占有率的产品称为明显产品,从财务报告上看,它总是能产生利润,但是高增长往往意味着高投资。某种情况下,它不代表着自给自足。如果市场份额处于垄断或者领先地位时,那么企业不必再维持投入以保持高增长,此时产品能源源不断地维持现金流,它被称为现金牛。
现金牛产品的特点是高市场份额和低增长率。产品已经迈入成熟期,其特征是产生大量的现金收入,数额远大于维持市场份额所需再投入的资金,是企业支持其他产品的后盾。
低增长率-低占有率的产品叫做瘦狗产品,这类产品对企业都是鸡肋,财务特点是利润率低、处于保本或亏损状态。这类产品往往会实行撤退或者整顿的战略。
低市场份额而高增长率的产品是问题产品,这些产品吸纳的资金总是多于所产生的资金。虽然高增长率意味着市场未来潜力好,但是份额不高要打上一个问号。不投入资金,产品会衰亡,即使投入资金,若只能勉强维持住市场份额。那么它最终仍属于瘦狗产品。
象限是动态的,明星产品的目标是成为现金牛,问题产品需要摆脱泥沼增加市场份额,而所有的产品都可能衰退为瘦狗。
八、矩阵思维
实际上,在我最初学习波士顿矩阵的时候,我对现金牛、瘦狗的概念依旧一知半解。但我牢牢记住了矩阵式思考,记住了象限划分。
何为象限?我们拿两个量化指标将分析对象划分出多个种类:高-高、高-低、低-低、低-高,对象落在了四个象限,它便是矩阵思维下的产物
例如电商领域:
大家都应该听过爆款产品,在淘宝店铺运营中,爆款产品意味着高曝光量和低利润率。这个词第一次听其他运营提及时,他们说很多爆款产品并不赚钱,往往是做高店铺的流量。当很多人被爆款产品吸引过来的同时,会去购买店铺其他正常利润的商品,这里还会配合优惠券做交叉销售,提高营收,这种方法是俗称的带量。
在你不知道矩阵思维的时候,可能只有带量这么一个概念。而学会了矩阵,你就能听出上述那段话的两个指标:曝光量和利润率。现在用它们划分出四个象限。
数据分析思维每种类别的商品对应不同的运营策略,潜力商品可以在后期运营中增长曝光量,培养搜索权重;鸡肋商品则要优化转化率。这里通过象限梳理清楚了基于商品的运营逻辑,避免无头苍蝇般的抓瞎。
矩阵思维的一个优点是方便归类和聚焦,它是可以指导策略的。
商品的象限维度不止曝光量和利润率。我们可以尝试曝光量-转化率,去分析商品落地页的效果,比如高曝光量-低转化率的商品,是不是设计和文案有问题?也可以尝试利润率-回购率的象限维度,衡量商品长期的盈利多寡,某个商品虽然利润低了些,但是用户会反复购买,那么它也是半个明星产品。
矩阵思维可以应用在商品运营、用户运营、人员管理、时间管理、用户行为分析、用户需求分析、产品功能分析等多个场景上。
它之所以是一种经典的思维框架,在于将无序的数据通过象限归类为了有序。当面对一堆数据或信息一筹莫展时,想一想矩阵的象限划分,它也许就是点燃闪电的火苗。
九、马斯洛需求层次理论
马斯洛理论把需求分成生理需求(Physiological needs)、安全需求(Safety needs)、爱和归属感(Love and belonging)、尊重(Esteem)马斯洛需求层次理论和自我实现(Self-actualization)五类,依次由较低层次到较高层次排列。在自我实现需求之后,还有自我超越需求(Self-Transcendence needs),但通常不作为马斯洛需求层次理论中必要的层次,大多数会将自我超越合并至自我实现需求当中。
通俗理解:假如一个人同时缺乏食物、安全、爱和尊重,通常对食物的需求量是最强烈的,其它需要则显得不那么重要。此时人的意识几乎全被饥饿所占据,所有能量都被用来获取食物。在这种极端情况下,人生的全部意义就是吃,其它什么都不重要。只有当人从生理需要的控制下解放出来时,才可能出现更高级的、社会化程度更高的需要如安全的。
应用:
从企业经营消费者满意(CS)战略的角度来看,每一个需求层次上的消费者对产品的要求都不一样,即不同的产品满足不同的需求层次。将营销方法建立在消费者需求的基础之上考虑,不同的需求也即产生不同的营销手段。
根据五个需求层次,可以划分出五个消费者市场:
1. 生理需求→满足最低需求层次的市场,消费者只要求产品具有一般功能即可
2.安全需求→满足对“安全”有要求的市场,消费者关注产品对身体的影响
3. 社交需求→满足对“交际”有要求的市场,消费者关注产品是否有助提高自己的交际形象
4. 尊重需求→满足对产品有与众不同要求的市场,消费者关注产品的象征意义
5. 自我实现→满足对产品有自己判断标准的市场,消费者拥有自己固定的品牌 需求层次越高,消费者就越不容易被满足。