人民广场心理想法

R语言分布的卡方拟合优度检验

2021-05-01  本文已影响0人  Cache_wood

卡方拟合优度检验,用于衡量观测频数与期望频数之间的差异

一般地,假设总体分r类A_i,i=1,2,……,r,分布假设检验问题
H_0:p_i = P(A_i) = p_{i0},i=1,2,……,r;\\ 0< p_{i0}<r已知,且\sum_{i=1}^{r}p_{i0} = 1

在原假设下,期望频数E_i = np_i
假设从总体中随机抽取n个样本,并记O_i为样本中分到类中的个数,称为观测频数

K.Pearson在原假设H_0成立下:
\chi^2 =\sum\frac{(O_i-E_i)^2}{E_i} = \sum\frac{O_i^2}{E_i}-n \sim \chi(r-1)
因此,在显著性水平\alpha下,拒绝域为
W = {\chi^2 >\chi_{1-\alpha}^2(r-1)}

总体分布律已知

x<-c(315,108,101,32)
chisq.test(x,p=c(9,3,3,1)/16)
Chi-squared test for given
    probabilities

data:  x
X-squared = 0.47002, df = 3, p-value
= 0.9254

p-value = 0.9254>0.05,则不应拒绝原假设,孟德尔的结论是成立的。
同理,可以先计算出\chi_{0.95}(3) =7.81>0.47

某美发店上半年各月顾客数量如下,请问该店各月顾客数是否为均匀分布?


x<-c(27,18,15,24,36,30)
chisq.test(x)
    Chi-squared test for
    given probabilities

data:  x
X-squared = 12, df = 5,
p-value = 0.03479

总体分布律未知

k<-0:14
k1<-0:10
s = 0
x<-c(57,203,383,525,532,408,273,139,45,27,10,4,2,0,0)
x1<-c(57,203,383,525,532,408,273,139,45,27,10,6)
namda = sum(k*x)/sum(x)
p = (namda**k1)*(exp(-namda))/factorial(k1)#计算出p的理论值
p1 = 1-sum(p)
p<-c(p,p1)
chisq.test(x1,p=p)
    Chi-squared test for given
    probabilities

data:  x1
X-squared = 12.971, df = 11, p-value
= 0.2952



我们用R语言来模拟一下实际操作

x<-c(6,11,20,8,5)
a<-c(-Inf,14.55,14.95,15.35,15.75,Inf)
p<-pnorm((a[2]-15.1)/0.4325)-pnorm((a[1]-15.1)/0.4325)
for (i in 3:length(a)){
  q1<-pnorm((a[i]-15.1)/0.4325)
  q2<-pnorm((a[i-1]-15.1)/0.4325)
  p<-c(p,q1-q2)
}
p
sum(p)
chisq.test(x,p=p)
    Chi-squared test for given
    probabilities

data:  x
X-squared = 2.3639, df = 4, p-value =
0.6692

R语言实验结果与示例完全相同。

上一篇下一篇

猜你喜欢

热点阅读