因子方差分析
参考书 《白话统计学》
何时使用因子方差分析
因子方差分析适用于一个连续因变量以及两个或两个以上分类自变量的情形。
与单因子方差分析的不同
单因子方差分析指的是不同自变量在同一因变量上的不同,自变量不同,但是是同一类, 比如一二三年级每周看电视时间的不同,自变量是一二三年级。
因子方差分析可以比较多个类别的自变量。比如不同年级,不同地区的学生每周看电视时间不同
因子方差分析之后得到三个结果
-
主效应,即每一类的自变量的结果,如上举例,一个比较年级, 一个比较地区。和单独运行两次单因子方差分析基本一致
-
交互效应,对于一个自变量的不同分组而言,自变量的组间差异随着自变量的水平不同二不同,那就存在交互效应,交互效应又称调节效应
方差分析的理想状态是各组有大致相等的样本容量以及大致相等的变异量。同时按照多个变量分割样本,比如上述年级和地区,有可能会导致单元容量太小,以至于方差分析毫无意义,所以一般方差分析的单元不应少于10个对象,最好单元容量超过20。
因子方差分析
主效应以及控制或偏效应
因子方差分析对分析的各个自变量都会得到一个主效应,每一个主效应都有一个F值。如果分别针对各个自变量进行因变量的单因子方差分析,也会得到F值,二者相似,但是因子方差分析的主效应可以检验一个自变量对因变量的效应是否有显著的组间差异,同时有控制或者说排除了另一个自变量对因变量的效应。
例:
回到比较看电视时间是否不同时,假设发现一年级的学生看电视时间显著大于二年级,同时南方的学生看电视显著大于北方的学生,南方的学生中一年级的学生比较多,北方学生中一年级学生比较少。所以说可能会遇到潜在的问题,南方的学生看电视比北方的多可能是因为样本中南方学生一年级的较多,于是产生了“虚假事实”。所以我们的问题就是如何确定南北部学生的看电视时间是否存在除了地区年级不同引发的差异之外的差异,也就是是否出了年级之外,存在地区效应呢?
所以为了回答这个问题,就要吧年级解释的看电视时间的变异从总方差中剔除出去,那么就能检验是否有额外的部分方差可有学生来自的地区解释
image
因子方差分析,可以考察去除了分析中其他效应之后的各种主效应和交互效应
检验简单效应
在计算出主效应和交互效应之后,可以考察简单效应,与事后检验类似,功能是检验特定单元的平均取值之间是否存在显著差异
协方差分析
协方差分析的思想就是检验在控制了另外一个或者一组变量的效应之后不同群组在一个因变量上是否不同