工作生活

7.3 两个类别变量的相关性度量

2019-07-03  本文已影响0人  迪丽娜扎

1. φ系数:

φ系数主要用于检验2×2列联表的相关性度量,也就是二分类变量的相关性度量。公式为\varphi = \sqrt{\frac{\chi^2}{n}}

n为样本大小

φ取值在0-1之间,越接近1则两者相关性越强。0代表完全独立,1代表完全相关

2. Cramer's V系数

计算公式:

V= \sqrt{\frac{\chi ^2}{n \times min((r-1),(c-1))}}

其中 χ2是用列联表算出来的拟合优度,见7.1或7.2,n是样本个数,r和c分别是两个类别的取值数

V值也是取0-1,0表示完全独立,1表示完全相关

3. 列联系数

C=\sqrt{\frac{\chi ^2}{\chi ^2 + n}}

 χ2跟上面是一回事。当C=0时两个变量完全独立,但当两个变量完全相关时C也到不了1.

上一篇下一篇

猜你喜欢

热点阅读