R语言实现-T检验
写在前面
搬运自公众号bioLinkx
t检验用于检验两个总体均值是否一致,分为单样本t检验、独立样本t检验和配对样本t检验。
t检验适用条件:小样本、正态分布、方差齐性
若是单独样本T检验,必须给出一个标准值或总体均值,同时,提供一组定量的观测结果,应用t检验的前提条件是该组资料必须服从正态分布;若是配对样本T检验,每对数据的差值必须服从正态分布;若是独立样本T检验,个体之前相互独立,两组资料均取自正态分布的总体,并满足方差齐性。
image.png
在进行t检验之前,应该对数据进行正态性检验和方差齐性检验。
单样本t检验
单样本t检验:用于样本均数和已知总体均数之间的比较。
#某鱼塘水的含氧量多年平均值为4.5mg/L,现在该鱼塘设10点采集水样,测定水中含氧量(单位:mg/L)分别为:
#4.33,4.62,3.89,4.14,4.78,4.64,4.52,4.55,4.48,4.26,问该次抽样的水中含氧量与多年平均值是否有显著差异?
Sites<-c(4.33,4.62,3.89,4.14,4.78,4.64,4.52,4.55,4.48,4.26)
t.test(Sites,mu=4.5,alternative = "two.sided")
#mu:理论平均值,默认值为0
#alternative:备择假设。允许值为“two.sided”(默认),也可以根据需要设置为“greater”或“less”
One Sample t-test
data: Sites
t = -0.93574, df = 9, p-value = 0.3738
alternative hypothesis: true mean is not equal to 4.5
95 percent confidence interval:
4.230016 4.611984
sample estimates:
mean of x
4.421
p=0.37>0.05,故认为所抽样水体的含氧量与多年平均值没有明显差异
配对样本t检验
配对样本t检验适用于配对资料的计量资料,主要有三种应用情形:同质受试对象分别接受两种不同的处理、同一受试对象分别接受两种不同的处理、同一受试对象自身前后的对比。即配对样本t检验用于样品的两个相关组之间。
例如,在一个月内对20只小鼠进行药物治疗,想知道该药物是否会对小鼠体重产生影响。在药物治疗之前和治疗之后分别测量20只小鼠的体重,使用配对t检验比较治疗前后的平均体重。
# 治疗前小鼠体重
before <-c(15.4,25.3,25.6,34.7,28.8,18.9,30.0,36.7,25.8,27.7)
# 治疗后小鼠的体重
after <-c(32.5,23.4,36.7,35.7,38.7,32.5,32.4,37.0,26.7,30.0)
# 创建数据框
my_data <- data.frame(
group = rep(c("before", "after"), each = 10),
weight = c(before, after)
)
print(my_data)
样本量n<30,需要检验配对的差值是否服从正态分布
# 计算之前前后的差异
d <- with(my_data, weight[group == "before"] - weight[group == "after"])
#Shapiro-Wilk正态性检验差值是否符合正态分布
shapiro.test(d)
# p-value = 0.11
p>0.05,表明差值(d)服从正态分布,可以使用配对t检验。
# 配对样本t检验
res <- t.test(after,before, paired = TRUE)
# 显示结果
res
Paired t-test
data: after and before
t = 2.7111, df = 9, p-value = 0.02395
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
0.9388936 10.4011064
sample estimates:
mean of the differences
5.67
p=0.024<0.05,否定原假设,并得出结论治疗前小鼠的体重与治疗后小鼠的体重显著不同。
也可使用以下代码:
res <- t.test(weight ~ group, data = my_data, paired = TRUE)
此外,若要检验治疗前小鼠的体重是否小于治疗后体重:
t.test(weight ~ group, data = my_data, paired = TRUE,alternative = "less")
若要检验治疗前小鼠体重是否大于治疗后体重:
t.test(weight ~ group, data = my_data, paired = TRUE,alternative = "greater"
独立样本t检验
两独立样本t检验用于比较两组独立样本间是否存在差异,但需要注意的是数据需满足正态分布。
方差齐性:可以使用student-t检验方法比较两组差异
方差不齐:使用校正的student-t检验方法,即Welch t检验比较两组差异
###比较南北方身高差异
c1<-c(152,176,159,160,166,155,178,160,166,150)
c2<-c(165,158,166,168,160,180,169,180,170,175)
data<-c(c1,c2)
a <-factor(c(rep(1,10),rep(2,10)))
###Shapiro-Wilk正态性检验
with(my_data, shapiro.test(weight[group == "south"]))
#p-value = 0.4544
with(mydata, shapiro.test(weight[group == "north"]))
#p-value = 0.5992 两组数据均符合正态分布
###方差齐性检验
res.ftest <- var.test(weight ~ group, data = mydata)
##p-value = 0.5148>0.05,因此认为两组数据的方差之间没有显著差异(方差齐性)
两组数据独立,呈正态分布且满足方差齐性,可以使用student-t检验
res <- t.test(weight ~ group, data = mydata, var.equal = TRUE)
###方差不齐时使用Welch检验,var.equal = FALSE
Two Sample t-test
data: weight by group
t = 1.8152, df = 18, p-value = 0.0862
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-1.086268 14.886268
sample estimates:
mean in group north mean in group south
169.1 162.2
p=0.0892>0.05,可以得出结论,南北方身高没有差异。
参考链接