R中的常用的检验方法

2020-11-23  本文已影响0人  生信编程日常

1.独立样本的t检验

t.test调用格式1:其中是一个数值型变量,x为二分变量

t.test(y~x, data)

t.test调用格式2:其中有y1,y2为数值型变量。

t.test(y1,y2)

例子:比较美国南方与非南方地区犯罪的监禁概率是否相同。

library(MASS)
t.test(Prob ~ So,data=UScrime)
输出:
Welch Two Sample t-test

data:  Prob by So
t = -3.8954, df = 24.925, p-value = 0.0006506
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -0.03852569 -0.01187439
sample estimates:
mean in group 0 mean in group 1 
     0.03851265      0.06371269

因此,可以拒绝南方与非南方各州犯罪具有相同监禁概率的假设。

2.非独立样本的t检验

如,年长的男性与年轻的男性失业率概率是否相同,此时,年龄与失业率是有关的,所以是非独立的。
非独立样本的t检验假定组间差异呈正态分布。
调用格式:其中y1,y2为非独立的数值向量

t.test(y1,y2,paired=TRUE)
library(MASS)
with(UScrime, t.test(U1,U2,paired=TRUE))
输出:Paired t-test

data:  U1 and U2
t = 32.407, df = 46, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 57.67003 65.30870
sample estimates:
mean of the differences 
               61.48936 

因此,可以拒绝不同年龄男性失业率相同的原假设。

3.卡方独立性检验

卡方检验可以使用chisq.test()函数对二维表的行变量或者列变量进行检验。

library(vcd)
mytable<-xtabs(~Treatment+Improved, data=Arthritis)
mytable
chisq.test(mytable)
输出:
Pearson's Chi-squared test

data:  mytable
X-squared = 13.055, df = 2, p-value = 0.001463

因此,治疗与改善效果并不独立。

##############################################################
以下为在真实病例中的应用,检验两种不同的疾病与年龄,性别以及发病部位有无显著差异。

library(vcd)
library(xlsx)
data<-read.xlsx("DiseaseData.xlsx",sheetIndex = 1)
head(data)

性别以及发病部位与两种病的关系用卡方独立检验:

a<-xtabs(~class+sex,data)
b<-xtabs(~class+part,data)
chisq.test(a)
chisq.test(b)

比较年龄(单位:月)与两种病是否有相关性,用t检验

t.test(age~class,data)
上一篇 下一篇

猜你喜欢

热点阅读