商业洞察需要的是数据思维!
如何通过数据思维挖掘商业洞察
商业洞察一直以来都是比较神秘的话题,如何从一堆数据中找到新的商业机会,找到满足客户的需求,在市场数据中找到新的机会点,在过去的数据中找到未来的发展趋势并对未来做出预测,在内部数据中找到内部管理的问题并发现解决问题的方案?这些都是看似神秘。
商业洞察有一定的方法和规律,商业洞察的发现需要多年的实践经验。以下是笔者总结的从数据中探寻商业洞察的方法和思路,供读者参考。
1.1 寻找关键要素
探讨事物时寻找决定事物的关键要素是最简洁、最直接的方法。寻找一个问题的解决方案时也要寻找决定该事物的关键要素。在商业环境下,事情都会变得非常复杂,涉及面非常广,这时需要管理者们能够跳出相关的盒子,从整体上认识事物,并确定事物的关键要点,在关键要点上寻找解决问题的思路。
比如营销的问题,核心点是客户需求的满足,如果不把核心点聚焦在客户需求满足上,则市场营销活动就会产生浪费。发起一个市场营销的促销活动,首先要看该活动满足了客户的什么需求,在参与活动中他们能够得到什么,以及他们所得到的是他们需要的吗。这就是营销的要点,在这个要点的基础上再去寻找方法。
做公司战略研究,也要找到企业成功的关键要素,KSF(KeySuccessFactors,关键要素分析)是我们分析战略的重要手段。关键要素可以分成两类,一类是必要条件,另一类是充分条件。如果能够找到充分条件,再看满足充分条件的成本和实际完成该件事的收益是否对等,如果不对等,则不会采取措施,等条件成熟后再去考虑。必要条件是完成一件事必须的条件,但有了该条件,事情可能也无法完成。我们非常希望挖掘每件事情的充分条件,但探索充分条件或者把握充分条件是一件比较困难的事情。
寻找关键要素的方法很直接也很简单,但仍然有很多人在实际工作中忽略。
1.2 寻找差异
寻找差异是我们人类认知事物最基本的方法。在企业大数据应用中,看数据的第一眼就是看数据的差异,这里说的差异也包括本来存有差异的事物间的共性。
看到一组数据的第一反应就是看数据间的差异,差异会引导着我们去思考存在差异背后的原因。比如,上个月销售5000万元,这个月销售额4500万元,差异500万元,为什么少了?是行业下行趋势还是行业的季节性波动?哪些方面没有做好?哪些产品的销售额减少了?哪些区域市场的销售额减少了?哪些业务员的业绩减少了?为了探寻差异,需要对这个数据再细分下去,然后在拆分后的数据中再次寻找差异。寻找差异是我们的第一反应,这种反应是数据思维的反应,但需要在这个反应中更加理性化地去看待数据。此例中,在知道两个月的销售额差异后,按照销售额的来源追问下一级别数据,即在子项中去寻找。销售额的子项可以是客户、产品、业务员、市场区域等。
在寻找差异的时候,除了寻找数据的差异,还会比较差异的大小,根据差异的大小来区别对待,看是否需要采取更加深度的分析。我们一般能够感受到的差异在5%以上,5%的差异在商业上是比较容易接受的误差,超过5%的误差,一般都要深究其变化背后的驱动因素。如果变化超过30%,就需要深度分析原因了。
在设定差异的时候,可以设定一个阈值,比如5%、10%、15%等,这与统计学上的置信区间类似。利用统计的方法对事物进行测量时,会设定重大决定要求置信区间为95%(即5%),一般商业决策或者初期测量按照85%设定,即15%。在做市场研究的时候对比两个产品的差异,利用统计学的方法来测评产品,如果是初期研究,就设定置信区间为85%,如此采样少,成本低;如果是上市前的测评,则需要加大样本量,以95%的置信区间来测评,评价两个产品之间是否存在显著性差异。
对差异大小的敏感度在企业发展的不同时期会有不同的要求,企业刚开始快速发展时,对未来的估计量误差很大,一般会容忍20%的预计误差;当企业相对成熟,业务相对稳定时,对业绩的预期与实际的误差一般按照10%来估测,如果是10%以内,则认为是随机波动导致的,如果大于10%就需要深度追究背后的问题。
除了量化的差异之外,还有定性方面的差异比较。比如客户的需求、评价、关注点、行为、地理位置等,这些差异的比较也会给我们很多启发,从而找到事物发展的规律。对于任何事物我们都可以从其属性和要素的角度进行对比差异,当然选择要素和属性的时候,每个或者每一类事物都有其独特的属性需要关注,重点属性和要素是我们认识事物的关键点。
1.3 寻找关系
经营企业最希望知道的诀窍就是事物间的因果关系,如果我们知道做好了A必然得到B,就太幸福了,可是事物的发生和发展大多都不是这种直接的因果关系。
比如当我们真的投入100万元做广告的时候,是否能够得到1000万元的产出,这个谁也不敢保证,因为在打广告的时候,预计和实际差异总有偏差,广告效果受多种因素的影响,所以无法精确估算广告带来的效果,但是我们一直没有停止探寻这个关系。
有了较好的理论,但在推行的时候,理论是抽象的现实,落实到现实时,不可预计因素影响了理论效果的实现。
当知道了一个事物的影响因素,并对相关的影响因素进行量化,通过多年的经验构筑一个数学模型,在实际应用中利用数学模型能相对准确地预测未来的销售额和利润,但在新的大数据时代,外部环境变化速度越来越快,数学模型所预测的误差越来越大,我们不得不经常修订数学模型以满足管理决策对准确程度的要求。
比如,可以构筑一个数学模型,表示广告投入和销售产出之间的关系,即:
Y(销售增加值)=f(X–广告投入)
如果有足够多的数据,就能够做出相对准确的数学模型来预测。掌握的数据量越大,对该模型的准确程度越自信;但环境变化的速度会影响该模型的准确性,用历史数据构建的模型,对未来的适用程度也会随着减弱。所以,要根据新的市场环境和竞争环境,以及媒体环境进行修订。
在大数据时代,统计学的计算方法和全数据集的计算方法,大部分仍然适用,至少其算法思想还是可以使用的。比如事物的相关性,虽然大数据给我们的是全数据集,但对样本数据集的算法,在相关性计算的算法上,还是有着高度的相似性的。比如在数据时代下的数据集中,探寻两个事物时间关系的时候,仍然可以使用统计学的计算方法。
大数据给我们提供了更多的数据,可以利用大数据集中丰富的数据来构建多种事物之间的关系,从而获得更多的产出关联。比如大数据文章或者书籍中经常提到的啤酒与尿布之间的关联关系。该故事说,大数据研究人员在对沃尔玛的购物车进行分析的时候发现,啤酒和尿布经常出现在同一个购物车中,于是沃尔玛就把啤酒和尿布放到一起摆放,结果销量大增,后来才发现缘由:在美国给孩子购买尿布的一般都是爸爸,而大部分孩子的爸爸在经历一天繁忙的劳碌之后,等孩子睡着了,总要喝几罐啤酒来休息。且不管这个故事的真实性有多高,但其思路和算法是正确的。通过分析购物车中的产品间的相关性,我们完全可以把经常出现在同一个购物车中的产品摆放在一起,以大幅度减少消费者在购物过程中寻找多个产品所耗费的时间,同时,因为经常一起采购的商品被放到一起,也能够起到提醒的作用,原本没有打算购买啤酒的消费者,在购买尿布的时候,看到旁边摆放着喜欢的啤酒,就会一起购买了。这种算法叫作购物篮分析,或者叫购物车分析。这个算法也经常用到电商数据分析中,通过了解消费者在网店中购买产品时的组合,在网站上给购买组合中某一产品的客户推荐另外一个产品,可以大幅度提升消费者一次性购物的总额。
这种关系称作关联关系。购买尿布和啤酒之间本身没有因果关系,而只是在特殊原因下所产生的相关关系。比如,夏天到了,啤酒的销量大幅度上升,与此同时,溺水死亡人数也大幅度上升,但不能说喝啤酒导致了溺水死亡,两个现象的背后有着一个共同的原因:天气热了。所以,不能根据现象的共生关系来推理两者之间的因果关系。
相关关系虽然不能简单认为是因果关系,但可以从相关关系上获得对事物的认知。当了解到两个现象之间具有较强的相关性之后,就可以利用一个简单的、容易获得的数据来评测另外一个数据。将我们复杂的事物关系简单化,从而能够更快地采取相关的措施来应对事物的恶化,或者采取必要的手段抓住一些机会。通过一个较早的数据信息来评测另外一个较晚或者较难知道的数据,就能够做好更多的准备。
1.4 寻找特征
人类认知事物一般通过比较识别事物的差异,比较事物的特征。当我们识别其他事物的时候,也是根据事物的特征来识别的,比如植物学中识别植物时就是根据各种植物所体现出来的各种特征而将其分成了门、纲、目、科等不同层级的分类,同一种分类下有相同的特征,不同的子类间有相关的差异。
对企业积累的大数据进行分析或者解读的时候,分析数据的特征是一个初级但有效的方法。在识别一个数据的特征时,通过数据的可视化来体现数据的特征。可以利用统计学描述统计的方法对数据进行特征探寻,如下图所示。
左图表示数据集的偏度,右图表示数据集的峰度
在观测数据的特征时,第一步要做的就是评判这组数据的分布情况,我们用描述统计的方法来进行。通过做数据值的分布图,可以了解其集中的数据是如何分布的,偏度是大(正)还是小(负),以及是否符合正态分布的特征等。
通过观察事物的变化状况来了解数据背后的特征。将数据放到线图上,可以看出该数据随着时间变化的趋势,包括季节性和长期增减趋势,如下图所示。
具有较强季节性变化的市场(价格变化)
通过分析长期数据的变化特征,可以从长期变化特征中找到事物变化的规律。比如行业发展的S曲线,新技术应用的波峰曲线等,如下图所示。这些都是我们长期观察一个新鲜事物得到的,并在过程中逐步验证。
技术发展的波峰曲线
大数据本身是一个新的技术,在这个技术被发现并应用的过程中也会经历曲线发展变化趋势。在触发期,大家对大数据的认知很少,但随着应用案例的不断出现,会有越来越多的人开始呼吁新技术,以至于人人都在谈论大数据,媒体也在炒作,技术领袖也会出来背书。当炒作到一定热度的时候,期望值过高,而技术不成熟,普及难度会增加,很多失败的案例开始涌现,再加上媒体开始发挥其夸大本性,对新生技术口诛笔伐,银行家和投资者也会失去信心,使其进入“幻灭期”。新技术本身都有一个逐步成熟的过程,其价值发挥也需要一定的发酵和酝酿过程。
大数据技术也有逐步被炒热的嫌疑,其真正能够为社会创造价值,需要更长的时间来探索和发现。根据过去的历史经验可以判断,大数据概念也会有从过热到幻灭的过程,但希望我们这次会更加理性地看待,不过度追风大数据的同时,也不能低估大数据在未来能够发挥的作用,在投资上、在技术投入上、在对大数据创业公司的支持上,能够更加科学和理性,让大数据技术稳步发展。
1.5 寻找规律
人类探索自然和宇宙的过程就是一个寻找规律的过程。我们通过对自然现象规律的探寻,创造了自然科学,并对自然现象进行抽象,衍生出数学、物理学、化学等各种自然学科。探寻事物发展的规律可以按照规律来指导实践过程,从而能够更加有效地控制产出,得到我们想要的结果。
大数据时代提供了更加丰富的数据,通过这些数据能够对身边的事物进行更加详细的解读,从而为我们探寻规律提供更多的素材。
商业管理活动不可能像科学家一样做精准的测量,但是在大数据时代,丰富的数据让我们对所处的环境有了更加清晰的认知,越来越多的智能设备记录企业各种资源的各种活动和路线,以及企业相关资源的转换活动,我们能够非常容易地追溯到每个活动所产生的效果,更加准确地测量想要测量的对象及其活动,这为我们研究资源转换效率、优化资源配置提供了更好的素材,在这个基础上来总结事物发生和发展的规律变得更加方便。
这里说的是更加方便,而不是更加容易。因为数据庞大,数据分析和挖掘技术还不够完善和成熟,我们对数据的处理能力限制着探寻到的数据规律以及该规律的有效性、可重复性以及逻辑性。我们利用数据的关联可以采取商业决策,具体这个规律所能够适用的条件,我们也无法知晓,只能通过实践来验证,并在试错中进一步前行。
比如,我们前面提到过的啤酒与尿布之间的关联关系,我们无法知道这个关联关系在法国的家乐福中是否成立,也不知道这个案例在中国沃尔玛商场中是否成立。在我们不知道这些规律背后的逻辑所成立的条件时,所采取的商业举措也必然带有很高的试错风险。但是我们可以在法国的家乐福和中国的沃尔玛中利用关联算法来分析购物车。算法本身就是研究规律的规律。
目前大数据技术在很多个算法模型上取得了很好的突破,包括基于地理位置的LBS,基于时间轴的Timeline分析,基于标签的画像技术,基于字典的文本挖掘技术,基于点对点的联结技术等,当然更多的技术还在研究、发展和创新中,肯定会不断突破。
在大数据领域相关规律的探寻上,原有的统计学、数学理论、商业智能等相关的技术仍未过时,仍然对大数据技术有帮助,甚至可以说是必不可少的补充。
作为企业的数据分析人员,基本的统计学方法、数学方法、统筹学的相关方法仍然是基础,即使是大数据时代,这些方法也非常有用,能够为公司的数据管理提供基本的分析方法。
1.6 寻找奇异点
与统计学的思路和方法不同,大数据时代更加关注奇异点或者叫作特殊点。大数据是全面的数据,所有的奇异点都会被发现,而奇异点是企业发现新方法和新思路的重要地方。在统计学的方法中经常先把奇异点去除掉之后再进行相关数据的分析计算,而在大数据的方法中,我们会给予奇异点更多的关注,并试图理解奇异点的奇异之处,从而为企业的管理创新寻找机会点。
在企业管理活动中会经常碰到奇异点,比如有几十个业务员,那么总有几个业务员有着超越其他人的业绩,也总有几个业务员业绩排名在最后,对于优秀业务员业绩和活动的分析总结实现优秀业绩的方法,从而指导我们进行业务人员的招聘、培训和日常活动管理。
在大数据时代,我们能够采集更多的信息和数据,记录更多的行为和活动过程,可以通过解剖活动和过程的方法详细地分析最好的和最差的区别,然后在最重要的区别上进一步尝试和分析,也可以根据需要采集新的数据分析特定资源的转换活动以及转换方法。
奇异点的分析能够给我们更多的启发。一个事情存在,必然有其产生的根源,奇异点的出现也有其产生的土壤。对于奇异点的分析,能够带来更多创新的思路。一个新的业务员能够拿下一笔大单,不会是天上掉下的馅饼,自然有其成交的核心方法。在对社会资源和公司资源的综合利用上进行分析,再对比其他的业务员,找到他们行为的差异,并对其成交的过程进行复盘,深度分析客户过程中的决策驱动因素,找到有效的说服客户的办法,为团队提供营销的思路。
1.7 寻找“配方(结构)”
一个产品的构成有其基本的配方,也有其合理的生产工艺流程,最后组装成为一个产品,我们把部件组成和生产工艺流程看做这个产品的“配方”。
企业也可以看做是一个由复杂的“配方”组成的,包括可见的人、财、物和信息,也包括不可见的企业的品牌、商誉、客户关系、企业文化、经营管理诀窍、组织流程等,因此如果我们能够将这些可见的资源和不可见的信息进行配置,并按照合理的流程、工艺和方法完成资源间的转换,从而实现资源的最大化利用,实现最大产出。
一个管理者的优秀绩效表现在具有同等资源输入的情况下,最大化的价值产出。比如一个连锁餐饮店或者一个连锁美容服务店“配方”要素有:人员、流动资金、房租、店面面积、店面投资(包括各种装修等)以及市场营销的相关费用,而产出就是利润,当然根据企业的要求不同或许会有差异。从而有了这样一个配方模型——DEA模型(DataEnvelopAnalysis数据包络分析模型),如下图所示。
DEA模型
从常识的角度去了解,在输入的资源方面,如果店面面积确定了,则销售费用投入会带来更多的客流,但销售费用的投入会有边际效应递减的现象,而带来的客流量也有一个接待能力的限制,所以当该店的上座率达到一定水平之后,就无法再继续增加,进一步的销售推广活动也变得没有更多产出,存在费用浪费的情况。既然店面的面积确定了,能够接待的最大客户数量也就确定了,对业务人员或者服务员的要求的最大值就固定了,再增加服务员的数量,只会让更多的服务员闲置,造成浪费。所以,肯定有一个最佳的组合,那么这个组合的配方怎么研究呢?
存在多个店面之后,我们可以根据投入要素和产出要素在多个店面的实际情况来构建数学模型,从而评价哪个店面的配方最为合理,由此形成了在统筹学上经常用到的DEA模型,该模型不仅能够根据现在店面的运营状况得出一个相对较好的配方,而且针对每家店面,能够得出哪些要素投入多了,哪些方面投入少了,然后可以优化。
在对企业进行分析的时候,用配方理论来了解公司的各种资源构成和隐性配方组建的构成,往往能够找到企业管理问题的根源。笔者曾经为某个企业提供咨询服务的时候,其一直解决不了品质问题和营销的问题,我们把人员数量占比、工资占比、平均工资进行对比之后发现,营销人员的工资占比只占全员工资总额的5%,而且有些年份只占2%,这远远低于行业12%~15%的水平。没有对营销人员工资进行投资,如何发展这方面的能力?在品质管控方面,人员数量占比达到行业的平均水平,但平均工资非常低,甚至低于某些后勤团队的平均工资。工资不高意味着人员的素质和能力偏弱,没有高薪聘请品质管控的高手,如何打造出高品质的产品?通过数据可以看出问题的根源和企业需要做出的调整。
一个部门也可以看做是一个配方组成的组织,通过数据对部门进行分析,对部门进行评估,寻找部门发展的思路和方法。一个市场的策划方案也需要一个对资源进行配置的配方,精准的市场营销就是考虑聚焦于最有效的资源配置方法,合理的营销活动配方会让市场活动的投入产出效率更高。
全文摘自《企业数据化管理变革-数据治理与统筹方案》赵兴峰著
该文转载已取得作者认可
版权说明:版权所有归明悦数据所有,如需转载请联系我们,我们将在第一时间处理,或请注明内容出处(《企业数据化管理变革》赵兴峰著),非常感谢!【往期内容已在(明悦数据)公众号同步发布】
下期内容更实战!