统计学(72)-线性相关系数及其置信区间
2020-04-09 本文已影响0人
Zhigang_Han
Pearson相关系数(r)给出了两个变量之间线性相关大小的度量指标。
(1)这就带来一个问题,到底怎样才算相关性强或弱呢?
即使相关系数再大,也只是一个样本数据的统计量,如果想要推论到整体,则必须进行假设检验,证明相关系数不是偶然得到的。
(2)t检验法
因为相关系数的无效假设是r=0,备择假设为r不等于0。
用t检验对r进行假设检验的公式为:
image.png
式中,分子是样本统计量与参数值的差值,分母是线性相关系数的标准误。统计量t(r),服从自由度v=n-2的t分布, n为样本量。
(3)置信区间法
已知线性相关系数的标准误为:
在计算置信区间的时候,我们首先要明确r的抽样分布要对称,即总体相关系数为0.
(在此,采用一种迂回的方式,先把r转换为一个新的统计量z,使z的抽样分布近似正态,然后就可以按常规方式计算z的置信区间,最后把它还原回去,获得r的置信区间)
转换的新的统计量z为:
image.png
z统计量的标准误则为:
image.png
(4)计算置信区间
image.pngimage.png