SPSSAU数据分析入门教学

实用干货!因子分析超全步骤总结!

2020-06-28  本文已影响0人  spssau

因子分析是统计数据分析方法之一,因子分析包括探索性因子分析和验证性因子分析。本文主要讨论探索性因子分析。

一、研究背景

关于工作满意度有14个问题,调研得到215份问卷结果。希望通过因子分析,用少量因子反映14个题目的信息,从而达到降低维度,便于分析的目的,并对因子命名用于后续分析。

二、分析步骤

Step1数据准备:

依据研究目的,收集相关数据。本例中就是我们收集得到的14个问题的有关数据。

因子分析要求数据一定为定量数据,问卷数据一般为量表题。

Step2选项设置:

点击【进阶方法】--【因子分析】。

将分析项拖拽至右侧,点击[开始分析],即可得到分析结果。

设置[因子个数]:如果有预期想提取的因子个数,可以主动设置输出的因子个数。

勾选[因子得分]:可自动保存因子得分。

勾选[综合得分]:可自动保存综合得分。

Step3结果解释:

①判断数据是否适合因子分析

首先考察收集到的原有变量适不适合进行因子分析,我们利用KMO检验和Bartlett的检验结果进行判断。

表1:KMO和Bartlett的检验

上表展示KMO检验和Bartlett的检验结果

通常KMO值的判断标准为0.6。大于0.6说明适合进行分析,反之,说明不适合进行分析。同时Bartlett检验对应P值小于0.05也说明适合分析。

SPSSAU输出的结果中会给出智能解读结果,直接查看智能分析:

②判断提取因子个数

多数情况下,我们在分析时已经带着主观预期,希望题项如何归类,此时可以直接设置对应的因子个数。

本例中,工作满意度预期分为4个维度,因此将因子个数设为4。再进行分析。

表2:方差解释率表格

方差解释率表格,主要用于判断提取多少个因子合适。以及每个因子的方差解释率和累计方差解释率情况。方差解释率越大说明因子包含原数据信息的越多。因子分析中,主要关注旋转后的数据部分。

从上表可知:本次共提取了4个因子。此4个因子旋转后的方差解释率分别是24.993%,22.049%,20.191%,18.809%,旋转后累积方差解释率为86.042%。

说明4个因子能够提取14个分析项86.042%的信息量,这个值没有固定标准,一般超过60%都可以接受。

如果研究人员并没有预设维度。而选择默认选项,SPSSAU默认以特征根大于1作为标准。

特征根:指标旋转前每个因子的贡献程度。此值的总和与项目数匹配,此值越大,代表因子贡献越大。

当然因子分析通常需要综合自己的专业知识综合判断,即使是特征根值小于1,也一样可以提取因子。

碎石图

同时可结合碎石图辅助判断因子提取个数。当折线由陡峭突然变得平稳时,陡峭到平稳对应的因子个数即为参考提取因子个数。

实际研究中更多以专业知识,结合因子与研究项对应关系情况,综合权衡判断得出因子个数。

③判断因子与题项对应关系

上面提到确定因子提取个数除了要考虑以上指标,更重要的是结合因子与研究项对应关系情况判断。

因子载荷系数表,正是反映因子和研究项对应关系情况。

表3:旋转后因子载荷系数表格

从结果中可以看出,使用因子分析对14个项进行浓缩处理,浓缩为四个因子。

因子与题项对应关系,其中Q12-Q14在F1因子上有较高的载荷,说明F1因子可以解释这几个分析项,它们主要反映了工作报酬方面的满意度;

Q9-Q11在F2上有较高的载荷,它们主要反映了领导管理方面的满意度;

Q5-Q8在F3上有较高的载荷,它们主要反映了工作环境方面的满意度;

Q1-Q4在F1上有较高的载荷,它们主要反映了个人发展方面的满意度。

Step4结果调整:

如果出现因子分析结果与预期结果不一致,这种情况是非常常见的。对于不理想的题项可以移出该项,再次分析,直至所有分析项与因子对应关系良好。

如果出现以下3种问题,则需要对不合理题项进行删除:

第一类:如果分析项的共同度值小于0.4,则对应分析项应该作删除处理;

第二类:某分析项对应的”因子载荷系数”的绝对值,全部均小于0.4,也需要删除此分析项;

第三类:如果某分析项与因子对应关系出现严重偏差(通常也称作‘张冠李戴’),也需要对该分析项进行删除处理。

这部分在帮助手册中有详细介绍,有需要可阅读帮助手册中对应内容:

https://spssau.com/front/spssau/helps/advancedmethods/factor.html

Step5因子命名:

当确定了最终提取的因子数及题项对应关系,即可对提取的因子命名。

可以结合旋转后的因子载荷矩阵结果进行命名,最终将四个因子分别命名为F1工作报酬、F2领导管理、F3工作环境、F4个人发展。

三、后续分析

因子分析往往是预处理步骤,后续还需要结合具体研究目的进行分析,如回归分析、聚类分析等。

此时,可能需要用到因子得分,返回分析页面勾选[因子得分]即可生成因子得分。

如果是量表数据,建议通过【数据处理】--【生成变量】计算均值得到维度均值,用于后续研究。

四、其他说明

有关因子分析过程中可能遇到的问题,在之前的文章已经整理过,具体可参考:

https://zhuanlan.zhihu.com/p/150330786

上一篇下一篇

猜你喜欢

热点阅读