R语言分布的卡方拟合优度检验
2021-05-01 本文已影响0人
Cache_wood
卡方拟合优度检验,用于衡量观测频数与期望频数之间的差异
一般地,假设总体分r类,分布假设检验问题
在原假设下,期望频数:
假设从总体中随机抽取n个样本,并记为样本中分到类中的个数,称为观测频数。
K.Pearson在原假设成立下:
因此,在显著性水平下,拒绝域为
总体分布律已知
x<-c(315,108,101,32)
chisq.test(x,p=c(9,3,3,1)/16)
Chi-squared test for given
probabilities
data: x
X-squared = 0.47002, df = 3, p-value
= 0.9254
p-value = 0.9254>0.05,则不应拒绝原假设,孟德尔的结论是成立的。
同理,可以先计算出
某美发店上半年各月顾客数量如下,请问该店各月顾客数是否为均匀分布?
x<-c(27,18,15,24,36,30)
chisq.test(x)
Chi-squared test for
given probabilities
data: x
X-squared = 12, df = 5,
p-value = 0.03479
总体分布律未知
k<-0:14
k1<-0:10
s = 0
x<-c(57,203,383,525,532,408,273,139,45,27,10,4,2,0,0)
x1<-c(57,203,383,525,532,408,273,139,45,27,10,6)
namda = sum(k*x)/sum(x)
p = (namda**k1)*(exp(-namda))/factorial(k1)#计算出p的理论值
p1 = 1-sum(p)
p<-c(p,p1)
chisq.test(x1,p=p)
Chi-squared test for given
probabilities
data: x1
X-squared = 12.971, df = 11, p-value
= 0.2952
我们用R语言来模拟一下实际操作
x<-c(6,11,20,8,5)
a<-c(-Inf,14.55,14.95,15.35,15.75,Inf)
p<-pnorm((a[2]-15.1)/0.4325)-pnorm((a[1]-15.1)/0.4325)
for (i in 3:length(a)){
q1<-pnorm((a[i]-15.1)/0.4325)
q2<-pnorm((a[i-1]-15.1)/0.4325)
p<-c(p,q1-q2)
}
p
sum(p)
chisq.test(x,p=p)
Chi-squared test for given
probabilities
data: x
X-squared = 2.3639, df = 4, p-value =
0.6692
R语言实验结果与示例完全相同。