卡方检验 & Fisher exact 检验 & Mantel-
2017-12-01 本文已影响0人
桃桃桃吱吱吱
5.1 不同年龄段对各商场的购物倾向性是否存在差异
H_0:不同年龄段对各商场的购物倾向性无差异 H_1: 不同年龄段对各商场的购物倾向性存在差异
data1 <- matrix(c(83, 91, 41, 70, 86, 38, 45, 15, 10), byrow = F, nrow = 3)
chisq.test(data1) # Chi-square test
##
## Pearson's Chi-squared test
##
## data: data1
## X-squared = 18.651, df = 4, p-value = 0.0009203
结论: 在0.95的显著性水平下,可以拒绝原假设,即认为不同年龄段对各商场的购物倾向性存在差异。
5.2 不同种族与所支持的政党之间是否存在独立性
H_0:不同种族所支持的政党之间存在独立性 H_1:不同种族与所支持的政党之间相关
data2 <- matrix(c(341, 103, 405, 11, 105, 15), byrow = F, nrow = 2)
chisq.test(data2) # Chi-square test
## Pearson's Chi-squared test
##
## data: data2
## X-squared = 79.431, df = 2, p-value < 2.2e-16
结论: 在0.95的显著性水平下,可以拒绝原假设,即认为不同种族与所支持的政党之间存在相关性。
5.3 当前患某类肺炎和曾经患某类肺炎之间的疾病继承性关系
H_0:患某类肺炎和曾经患某类肺炎之间不存在疾病继承性 H_1:患某类肺炎和曾经患某类肺炎之间存在疾病继承性
由于观测数目较少,渐进$\chi^2$分布不再适用,应使用fisher.test
精确检验法。
data3 <- matrix(c(6, 1, 4, 19), byrow = F, nrow = 2)
fisher.test(data3) # Fisher's exact test
## Fisher's Exact Test for Count Data
##
## data: data3
## p-value = 0.002122
## alternative hypothesis: true odds ratio is not equal to 1
## 95 percent confidence interval:
## 2.152514 1362.408171
## sample estimates:
## odds ratio
## 24.2696
结论: 在0.95的显著性水平下,可以拒绝原假设,即认为存在疾病继承性。
5.7 学生家庭经济情况与其高考成绩之间的关系
H_0:学生家庭经济情况与其高考成绩无关 H_1:学生家庭经济情况与其高考成绩相关
-
首先使用
mantelhaen.test
消除层次因素干扰,检验学生家庭经济情况是否与其高考成绩相关 -
进一步使用
chisq.test
比较各类学校,分别检验学生家庭经济情况是否与其高考成绩相关
# Mantel-Haenszel test
school1 <- matrix(c(43, 87, 65, 77), byrow = F, 2)
school2 <- matrix(c(9, 15, 73, 30), byrow = F, 2)
school3 <- matrix(c(7, 9, 18, 11), byrow = F, 2)
data7 <- array(c(school1, school2, school3), dim = c(2,2,3))
mantelhaen.test(data7)
## Mantel-Haenszel chi-squared test with continuity correction
##
## data: data7
## Mantel-Haenszel X-squared = 11.638, df = 1, p-value = 0.0006461
## alternative hypothesis: true common odds ratio is not equal to 1
## 95 percent confidence interval:
## 0.3222519 0.7298350
## sample estimates:
## common odds ratio
## 0.4849646
# Further comparison
T1 <- chisq.test(data7[,,1]) # school1
T2 <- chisq.test(data7[,,2]) # school2
T3 <- chisq.test(data7[,,3]) # school3
T1; T2; T3
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: data7[, , 1]
## X-squared = 4.0557, df = 1, p-value = 0.04402
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: data7[, , 2]
## X-squared = 8.0736, df = 1, p-value = 0.004491
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: data7[, , 3]
## X-squared = 0.75768, df = 1, p-value = 0.3841
结论: 在0.95的显著性水平下,可以拒绝原假设,即认为学生家庭经济情况与其高考成绩相关。其中在第一和第二类学校,家庭经济情况与高考成绩相关性显著,而在第三类学校不存在显著关系。