R语言学统计【医学统计学 第四版】

第十一章 多因素试验资料的方差分析

2017-10-30  本文已影响55人  x2yline

第十一章 多因素试验资料的方差分析

x2yline
r Sys.Date()

知识清单

1. 析因资料的方差分析

1.1 基本概念

多个因素多个水平的全面交叉分为处理组,2因素2水平是至少每一组合至少重复2次

以下表为例:

  b1 b2
a1 24 44
a2 28 52

主效应和交互作用的区别就是加减号不同

1.2 基本思路

变异分解的思路

总变异分解为处理组间变异误差,处理组间变异继续分解为主效应交互作用

交互作用通常通过处理组间变异和主效应做差求得

自由度:
g=IJK个处理组,每组例数为n则总变异自由度为gn-1,A主效应自由度为I-1,B主效应自由度为J-1,C主效应自由度为K-1,AB的自由度为(I-1)(K-1)···,ABC的自由度为(I-1)(J-1)(K-1),误差的自由度为为g(n-1)也等于总自由度减去其余分解出来的自由度。

1.3 R语言实现

与前面的拉丁方分析一样【有一点不同是拉丁方没有考虑个因素直接的交互作用而使用aov(y~a+b+c),考虑交互作用则用aov(y~a*b*c),用aov函数按不同因素进行分解即可,如例11-3的数据:

data1 <- haven::read_sav(
  "E:/医学统计学(第4版)/各章例题SPSS数据文件/例11-03.sav")
# x是热感觉评分,a是军装类型,b是环境,c是活动状态
# 都应该转为factor否则会默认是数值而不是分组标识
data1$a <- factor(data1$a)
data1$b <- factor(data1$b)
data1$c <- factor(data1$c)
head(data1)
## # A tibble: 6 x 4
##       x      a      b      c
##   <dbl> <fctr> <fctr> <fctr>
## 1  0.25      1      1      1
## 2 -0.25      1      1      1
## 3  1.25      1      1      1
## 4 -0.75      1      1      1
## 5  0.40      1      1      1
## 6  0.30      2      1      1
summary(aov(x~a*b*c, data=data1))
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## a            4   5.21    1.30   3.032   0.0221 *  
## b            1   9.92    9.92  23.083 7.13e-06 ***
## c            1 283.32  283.32 659.096  < 2e-16 ***
## a:b          4   1.95    0.49   1.132   0.3472    
## a:c          4   1.48    0.37   0.862   0.4908    
## b:c          1  12.69   12.69  29.517 5.82e-07 ***
## a:b:c        4   1.61    0.40   0.935   0.4479    
## Residuals   80  34.39    0.43                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 2 observations deleted due to missingness

结果与教材上的一致,结论为不同军装,不同环境和不同活动状态的主观热感觉都有差别,但尚不能认为军装与其他两个因素存在交互作用(b,c)。

2. 正交设计与方差分析

上一篇下一篇

猜你喜欢

热点阅读