SPSS篇—回归分析
昨天跟大家介绍了一款做数据分析的利器—SPSS,不知道大家对这个软件的熟悉程度有没有提高一些呢?
今天给大家分享一下如何用SPSS Statistics来进行回归分析,我们通过一个实例来具体了解一下整个分析的过程以及结果的解读。
上图中就是本次需要进行回归分析的数据,之前有跟大家说过,SPSS Statistics的界面跟EXCEL是相似的,如果数据量比较小的时候我们可以直接输入到数据视图当中(也可以从EXCEL将数据粘贴过来)。图中的数据表达的是某公司1-11月份的商品销售情况,第一列是月份,第二列是当月销售商品种类数,第三列是当月的商品销售量。我们现在需要通过回归分析来了解商品上架种类和商品销售量之间是否有关系,如果有的话又是怎么样的一种关系,并且是否可以通过目前的数据来预测一下12月份的商品销售量情况。
上图是当我们输入完目标数据以后在变量视图中就会出现三行数据,每一行数据从上到下是同我们三列数据一一对应的,我们进行稍微的调整以后就可以开始我们的分析了。
如上图所示,我们需要从分析的工具栏当中选择回归,然后选择线性(回归的模型选择有很多种,本题中我们选择线性回归)。选择完了以后我们就能够进入到下面这个界面:
我们把商品销售量设为因变量,自变量为商品上架种类数,然后点击右侧的统计量选项:
在统计量里面我们需要选择D-W检验,这个检验就是之前文章跟大家说的残差检验,查看回归模型是否有问题。
在绘制项中我们选择输出残差直方图与正态概率图,我们可以通过这个图来大致确定数据是否存在自相关等情况。
其他的选项我们暂时以系统默认进行确定,不作更改。当我们点击确定以后我们就能够从输出界面看到我们本次分析的结果:
从上面结果图中我们可以看出,不管是R方还是调整后的R方都是在90%以上,说明本次回归模型的拟合效果是很好的。
从第二个方差分析结果图,我们可以看出方差分析的显著性为0.00<0.05,说明在本次分析中上架商品种类数和商品销量之间存在显著的线性关系。
从第三个系数图中,我们能看到整个回归分析的结果是很好的,t检验里的显著性水平0.00<0.05,说明本次回归方程的系数是显著的,具有统计学意义。本次回归分析的回归方程为:
Y=399.954+7.503X
到这里不知道大家是不是也认为整个回归分析就做完了。其实我们还有重要的一步没有验证,就是D-W检验,在第一个模型汇总图里我们能看到本次分析D-W的值是1.475,我们可以选择通过查询Durbin Watson table,也可以选择看我们输出的图来判断是否数据存在自相关等问题。
上面两个图就是我们输出的残差图,我们其实从图中也可以看出残差的分布没有呈现出明显的规律性,说明此题的数据不存在自相关等情况,本次的回归模型不用进行其他操作,可以直接使用。
最后,我们既然得出了我们的回归方程,我们也就可以对12月份的商品销售情况作出相应的预测,这个就只需要往回归方程里面代数就可以计算出来了。
到这里,我们本次SPSS Statistics的回归分析就全部做完了,今天也是给大家举了一个比较简单的例子,主要是让大家看看如果使用SPSS Statistics。在工作中我们需要的回归模型可能会比这个复杂,但是其实原理都是一样的,以后小白也会分享更多的回归分析方法来让大家学习。
快乐学数据分析,关注公众号:小白数据营;Q群:514581193