多因素方差分析_规模/位置对销量的影响
2019/2/24-星期日-阴雨天
今天做一下关于多因素方差分析的案例。
一、问题与数据
现希望对超市销售的某种商品进行调查,考察其销售额是否受到货架摆放位置的影响,以及超市规模是否也会有所影响,甚至两者间是否存在交互作用。超市的大小(三水平)、摆放位置(四水平)各随机选取了两个点,记录其一周内该货物的销量。
图1:同一周内货物的销售数据数据链接:https://pan.baidu.com/s/1IKwLlmCoM0_ssv6_uJDYVg
图2基于问题的思考:显然这个问题的因变量是销售额,分类变量有①超市规模,②货物摆放位置。
所以模型为:;其中、分别表示超市规模i水平和货物摆放位置j水平的附加效应。而 则为两者的交互作用项。
二、spss分析方法
1、选择Analyze→General Linear Model→Univariate (假设数据服从正态分布)
图1 图2 图3由图3的结果可知,无法得到方差齐性检验的分析结果。这是因为两个因素的各水平交叉,一共会形成12个单元格,这里就是要检验这12个单元格的方差是否齐。但是如果要再考虑交互作用的模型中进行方差齐性检验,每个单元格内至少要有3个元素(数据点)才可以。因此这里无法进行分析结果。所以可见在多因素时方差齐性检验往往价值不大。
解读主体间效应检验这个图表:
①修正模型:其假设为模型中所有的影响作用均无作用(即摆放位置、超市规模、两者的交叉作用均对销量没有影响),P值(.sig)远小于0.05,因此模型具有统计学意义,以上所提及的内容中至少有一个是有差异的。
②截距:其假设为模型中的常数项等于0,P值远小于0.05,因此拒绝原假设。显然它的分析无意义,忽略即可。
③分别对超市规模、摆放位置的效应进行检验,其假设为所有均为0,所有均为0。P值远小于0.05,因此拒绝原假设,即、 中至少有一个不为0。
④size*position,对超市规模和摆放位置的交互作用进行检验,可见P值为0.663>0.05,无统计学意义。
由上可知可以忽略两个因素之间的交互因素。可进行以下优化。
图4 图5下面对超市规模、摆放位置进行具体水平间差异使用S-N-K法进行两两比较。操作如下:
图6 图7从图7可以看出超市规模越大,相应的销量就越大。
图8从图8可以看出4种摆放位置对销量有影响,C位置的销量最大,其次是B位置,A和D位置的销量最小。
三、深入探究
①边际均数与轮廓图
边际均数是指基于现有模型,当控制所有其他因素作用时,根据样本情况计算出用于比较各水平的均数估计值。
轮廓图就是一种线图。
图11
从上图可以直观看出原始样本均数差异。
联合轮廓图就是含有多个变量的轮廓图。
图12:无因子交互作用 图13:有因子交互作用为了对模型的拟合效果进行观察可以使用残差图,残差图实际上就是一个散点图矩阵,由因变量实测值,预测值和标准化残差构成。
【选项】中勾选残差图
图14:残差图如果模型拟合效果很好,则预测值和实测值应当有明显的相关,呈现出较好的直线趋势。
拟和劣度检验
拟和劣度检验就是用当前模型和全模型效果相比的检验。如果无效假设被拒绝,说明模型不能充分刻画因变量,自变量之间的关系。P值等于0.663正好等于全模型中对交互项的检验P值。但在交互项多于一个的时候,拟和优势的检验优势就比较明显。
图15:失拟检验