7.3 两个类别变量的相关性度量
2019-07-03 本文已影响0人
迪丽娜扎
1. φ系数:
φ系数主要用于检验2×2列联表的相关性度量,也就是二分类变量的相关性度量。公式为
n为样本大小
φ取值在0-1之间,越接近1则两者相关性越强。0代表完全独立,1代表完全相关
2. Cramer's V系数
计算公式:
其中 χ2是用列联表算出来的拟合优度,见7.1或7.2,n是样本个数,r和c分别是两个类别的取值数
V值也是取0-1,0表示完全独立,1表示完全相关
3. 列联系数
χ2跟上面是一回事。当C=0时两个变量完全独立,但当两个变量完全相关时C也到不了1.