看见经营背后的变量——回归分析发现趋势

2020-08-06  本文已影响0人  柒元_

从定性分析到定量分析

当描述原因的解释变量是定性变量,描述结果的成果指标是定性变量时,在我们用z检验和卡方检验来比较成果指标的比例,来判断因果关系。

当描述原因的解释变量是定性变量,描述结果的成果指标是定量变量时,在我们用z检验和t检验来比较成果指标的平均值,来判断因果关系。

当描述原因的解释变量是定量变量,描述结果的成果指标是定量变量时,在我们能够分析什么呢?

某市场调查了过去一年顾客到店次数与消费金额的关系

5000个单元格的交叉表

这种数据基本上不是给人看的,实践中我们一般会使用分组汇总表

分组汇总的交叉表

然后正常情况下我们会首先关心“年度到店次数和消费金额之间的关系”。

我们进行卡方检验

得到的p值不到0.001,也就是说“到店次数与消费金额之间没有任何关系”的概率是非常非常低的。既然有关系,进一步考虑具体是什么关系,这样才有利于明确应该采取什么样的行动提升消费额。

回归分析揭示变量间关系

增加或降低到店次数那个更能提升消费金额?首先不能想当然的以为到店次数越多,消费金额就应该越大。如果是优质客户大多是偶然进店立刻产生消费,经常到店的是很多经常来闲逛的粉丝和只是开看看是否有新优惠的客户,这时贸然的“以增加到店次数为目的”投入营销资源,可能就会造成反效果。

在统计学中,回归分析指的是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。

我们希望通过回归分析发现“影响因素变量增加或减少一个单位,会导致结果增加或减少多少”这样的趋势。

针对刚才到店次数与消费金额的数据,以到店次数为横轴,以消费金额为纵轴,就可以画出一个散点图。

到店次数与消费金额的散点图

从图中可以看到,似乎到店次数多的人并不是来闲逛什么都不买的,他们到店次数越多消费金额也确实越高。那接下来我们在通过回归分析,到店次数对消费金额的影响的数学表达式。

在分析分散且存在误差的数据时,可以用使得“偏差的平方和”最小的数据来作为“真值”的推测值。实际上就是基于最小二乘法,使用数据的平均值作为代表值。同理,使用各组值的平均值连成的直线,就可以视为对趋势最恰当的表示。

到店次数与消费金额的平均值的直线

分析难以看见的关系

回归分析法基于数据统计原理,确定统计数据中某些影响因素变量与结果的相关关系,将关系表达成回归方程,用于预测影响因素改变导致的结果变化,让我们看见看不到的趋势。

应对不同数据类型和场景,还有很多回归分析方法用于分析变量间的关系式,无论是什么样的信息,只要能量化为数字,都有可能发现其中的隐含关联。

上一篇 下一篇

猜你喜欢

热点阅读