生信工具统计算法

多因素方差分析_规模/位置对销量的影响

2019-02-24  本文已影响22人  译本吐司

2019/2/24-星期日-阴雨天

今天做一下关于多因素方差分析的案例。

一、问题与数据

现希望对超市销售的某种商品进行调查,考察其销售额是否受到货架摆放位置的影响,以及超市规模是否也会有所影响,甚至两者间是否存在交互作用。超市的大小(三水平)、摆放位置(四水平)各随机选取了两个点,记录其一周内该货物的销量。

图1:同一周内货物的销售数据

数据链接:https://pan.baidu.com/s/1IKwLlmCoM0_ssv6_uJDYVg

图2

基于问题的思考:显然这个问题的因变量是销售额,分类变量有①超市规模,②货物摆放位置。

所以模型为:y_{ijk}=\mu +\alpha _{i}+\beta _{i}+\gamma _{ij}+\varepsilon _{ijk};其中\alpha _{i}\beta _{i}分别表示超市规模i水平和货物摆放位置j水平的附加效应。而\gamma _{ij} 则为两者的交互作用项。

二、spss分析方法

1、选择Analyze→General Linear Model→Univariate (假设数据服从正态分布)

图1 图2 图3

由图3的结果可知,无法得到方差齐性检验的分析结果。这是因为两个因素的各水平交叉,一共会形成12个单元格,这里就是要检验这12个单元格的方差是否齐。但是如果要再考虑交互作用的模型中进行方差齐性检验,每个单元格内至少要有3个元素(数据点)才可以。因此这里无法进行分析结果。所以可见在多因素时方差齐性检验往往价值不大。

解读主体间效应检验这个图表:

①修正模型:其假设为模型中所有的影响作用均无作用(即摆放位置、超市规模、两者的交叉作用均对销量没有影响),P值(.sig)远小于0.05,因此模型具有统计学意义,以上所提及的内容中至少有一个是有差异的。

②截距:其假设为模型中的常数项等于0,P值远小于0.05,因此拒绝原假设。显然它的分析无意义,忽略即可。

③分别对超市规模、摆放位置的效应进行检验,其假设为所有\alpha _{i}均为0,所有\beta _{i}均为0。P值远小于0.05,因此拒绝原假设,即\alpha _{i}\beta_{i} 中至少有一个不为0。

④size*position,对超市规模和摆放位置的交互作用进行检验,可见P值为0.663>0.05,无统计学意义。

由上可知可以忽略两个因素之间的交互因素。可进行以下优化。

图4 图5

下面对超市规模、摆放位置进行具体水平间差异使用S-N-K法进行两两比较。操作如下:

图6 图7

从图7可以看出超市规模越大,相应的销量就越大。

图8

从图8可以看出4种摆放位置对销量有影响,C位置的销量最大,其次是B位置,A和D位置的销量最小。

三、深入探究

①边际均数与轮廓图

边际均数是指基于现有模型,当控制所有其他因素作用时,根据样本情况计算出用于比较各水平的均数估计值。

轮廓图就是一种线图

图9 图10
图11

从上图可以直观看出原始样本均数差异。

联合轮廓图就是含有多个变量的轮廓图。

图12:无因子交互作用 图13:有因子交互作用

为了对模型的拟合效果进行观察可以使用残差图,残差图实际上就是一个散点图矩阵,由因变量实测值,预测值和标准化残差构成。

【选项】中勾选残差图

图14:残差图

如果模型拟合效果很好,则预测值和实测值应当有明显的相关,呈现出较好的直线趋势。

拟和劣度检验

拟和劣度检验就是用当前模型和全模型效果相比的检验。如果无效假设被拒绝,说明模型不能充分刻画因变量,自变量之间的关系。P值等于0.663正好等于全模型中对交互项的检验P值。但在交互项多于一个的时候,拟和优势的检验优势就比较明显。

图15:失拟检验
上一篇 下一篇

猜你喜欢

热点阅读