从chi-square到F-test,T-test
定义 其中
形状,随着自由度提升,越来越接近正太分布。
Chi Square distributions are positively skewed, with the degree of skew decreasing with increasing degrees of freedom. As the degrees of freedom increases, the Chi Square distribution approaches a normal distribution.
推论1 :chi-square其泛化形式为
-
1、对于Binomial分布,为success的次数。
-
2、用Normal Distribution来逼近Binomial
当n很大时,可以用高斯分布逼近:
即 -
3、化为标准正太:
由于:
所以:
得到其平方后服从chi-square distribution: -
4、化为泛化形式:
将,带入:
得到泛化的形式即:
检验1 Observation 与 Expectation 的一致性
构造,如果Observation 服从 Expectation 的分布,则该统计量服从的分布
F分布
定义
推论2:sample variance is proportional to a chi-squared distribution
检验2 两总体的方差一致性
由上述推论2,我们可以用两样本的sample variance构造F statistics
得到:
所以当时,两组方差的分布符合F统计量。
即
t分布
假设
对于变量: 【服从标准正太分布】
对于变量:【服从n-1度的t分布】
检验3 均值差异
在最简单的形式中,Anova(F-test)可以用以比较量2个或多个变量的均值,以此 generalize T-test。当在比较2组的时候,他们是等价的
我们拿个简单的例子,比较与在均值上是否存在差异(均值差异来自变量自身的variance还是组间差别):
当两sample来自同一分布时,以下统计量服从T分布。
PS:这里为了做简单的推导,所以将样本量都设为,其实将带入也是等价的。
Refer: https://www.jianshu.com/p/0daa59e481e3
关联
其实,F检验是T检验的一种泛化
Chi-square,F,T,几种分布,都与Gaussian Distribution有紧密的关联。很多问题都可以用不同的方法来检验。