R语言科研相关

R语言实现-T检验

2021-01-28  本文已影响0人  巩翔宇Ibrahimovic

写在前面
搬运自公众号bioLinkx

t检验用于检验两个总体均值是否一致,分为单样本t检验、独立样本t检验和配对样本t检验。

t检验适用条件:小样本、正态分布、方差齐性

若是单独样本T检验,必须给出一个标准值或总体均值,同时,提供一组定量的观测结果,应用t检验的前提条件是该组资料必须服从正态分布;若是配对样本T检验,每对数据的差值必须服从正态分布;若是独立样本T检验,个体之前相互独立,两组资料均取自正态分布的总体,并满足方差齐性。


image.png

在进行t检验之前,应该对数据进行正态性检验和方差齐性检验。

单样本t检验

单样本t检验:用于样本均数和已知总体均数之间的比较。

#某鱼塘水的含氧量多年平均值为4.5mg/L,现在该鱼塘设10点采集水样,测定水中含氧量(单位:mg/L)分别为:
#4.33,4.62,3.89,4.14,4.78,4.64,4.52,4.55,4.48,4.26,问该次抽样的水中含氧量与多年平均值是否有显著差异?
Sites<-c(4.33,4.62,3.89,4.14,4.78,4.64,4.52,4.55,4.48,4.26)
t.test(Sites,mu=4.5,alternative = "two.sided")  
#mu:理论平均值,默认值为0
#alternative:备择假设。允许值为“two.sided”(默认),也可以根据需要设置为“greater”或“less”
    One Sample t-test
data:  Sites
t = -0.93574, df = 9, p-value = 0.3738
alternative hypothesis: true mean is not equal to 4.5
95 percent confidence interval:
 4.230016 4.611984
sample estimates:
mean of x 
    4.421 
p=0.37>0.05,故认为所抽样水体的含氧量与多年平均值没有明显差异

配对样本t检验

配对样本t检验适用于配对资料的计量资料,主要有三种应用情形:同质受试对象分别接受两种不同的处理、同一受试对象分别接受两种不同的处理、同一受试对象自身前后的对比。即配对样本t检验用于样品的两个相关组之间。

例如,在一个月内对20只小鼠进行药物治疗,想知道该药物是否会对小鼠体重产生影响。在药物治疗之前和治疗之后分别测量20只小鼠的体重,使用配对t检验比较治疗前后的平均体重。

# 治疗前小鼠体重
before <-c(15.4,25.3,25.6,34.7,28.8,18.9,30.0,36.7,25.8,27.7)
# 治疗后小鼠的体重
after <-c(32.5,23.4,36.7,35.7,38.7,32.5,32.4,37.0,26.7,30.0)
# 创建数据框
my_data <- data.frame(
  group = rep(c("before", "after"), each = 10),
  weight = c(before,  after)
)
print(my_data)

样本量n<30,需要检验配对的差值是否服从正态分布

# 计算之前前后的差异
d <- with(my_data, weight[group == "before"] - weight[group == "after"])
#Shapiro-Wilk正态性检验差值是否符合正态分布
shapiro.test(d) 
# p-value = 0.11

p>0.05,表明差值(d)服从正态分布,可以使用配对t检验。

# 配对样本t检验
res <- t.test(after,before, paired = TRUE)
# 显示结果
res
Paired t-test
data:  after and before
t = 2.7111, df = 9, p-value = 0.02395
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
  0.9388936 10.4011064
sample estimates:
mean of the differences 
                   5.67 

p=0.024<0.05,否定原假设,并得出结论治疗前小鼠的体重与治疗后小鼠的体重显著不同。

也可使用以下代码:

res <- t.test(weight ~ group, data = my_data, paired = TRUE)

此外,若要检验治疗前小鼠的体重是否小于治疗后体重:

t.test(weight ~ group, data = my_data, paired = TRUE,alternative = "less")

若要检验治疗前小鼠体重是否大于治疗后体重:

t.test(weight ~ group, data = my_data, paired = TRUE,alternative = "greater"

独立样本t检验

两独立样本t检验用于比较两组独立样本间是否存在差异,但需要注意的是数据需满足正态分布。

方差齐性:可以使用student-t检验方法比较两组差异

方差不齐:使用校正的student-t检验方法,即Welch t检验比较两组差异

###比较南北方身高差异
c1<-c(152,176,159,160,166,155,178,160,166,150)
c2<-c(165,158,166,168,160,180,169,180,170,175)
data<-c(c1,c2)
a <-factor(c(rep(1,10),rep(2,10)))
###Shapiro-Wilk正态性检验
with(my_data, shapiro.test(weight[group == "south"]))
#p-value = 0.4544
with(mydata, shapiro.test(weight[group == "north"]))
#p-value = 0.5992  两组数据均符合正态分布
###方差齐性检验
res.ftest <- var.test(weight ~ group, data = mydata)
##p-value = 0.5148>0.05,因此认为两组数据的方差之间没有显著差异(方差齐性)

两组数据独立,呈正态分布且满足方差齐性,可以使用student-t检验

res <- t.test(weight ~ group, data = mydata, var.equal = TRUE)
###方差不齐时使用Welch检验,var.equal = FALSE
Two Sample t-test
data:  weight by group
t = 1.8152, df = 18, p-value = 0.0862
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -1.086268 14.886268
sample estimates:
mean in group north mean in group south 
              169.1               162.2 

p=0.0892>0.05,可以得出结论,南北方身高没有差异。

参考链接

https://blog.csdn.net/kmd8d5r/article/details/85815894

https://mp.weixin.qq.com/s?src=11&timestamp=1611210411&ver=2841&signature=Rn1*ulvIWzSmwcXu5s0vxoic6a9cJehuEAZfHCaaeWJjD3eWDljDEcfu1ETIfADGG2SaajFyku7ogmZWo7Ees75R3aQs6TkOLwHoo84szV8q2eMRZ8rDl8P529iBU-PF&new=1

https://mp.weixin.qq.com/s?src=11&timestamp=1611210411&ver=2841&signature=yvFnSXNAzS44-k4uyYMAVL6T--mOJpIqzd6iRU50I-MUduF0omqpsoF25NIjl1Oo7AulcxabpGknoxP2wTvYilZrzZvWmkOXR-VsEo9qrhZr6SxHw9x4cbXSm66kQ2fi&new=1

https://mp.weixin.qq.com/s?__biz=MzU1Mzc3OTIwNg%3D%3D&mid=2247488366&idx=2&sn=9905726993ecf1e364f5ec5266f837c3&scene=45#wechat_redirect

上一篇下一篇

猜你喜欢

热点阅读