卡方独立性检验
2020-05-23 本文已影响0人
limbo1996
参考书《白话统计学》
非参数检验
卡方独立性检验
适用于数据来自两个分类的变量,样本对象通过分类变量分成不同类型,检测根据一个变量进行的对象划分是否独立于另一个分类变量。
比如多个年级的男女生,检测男女生的学习成绩是否取决于它的年级。
卡方检验的目的
确定样本对象落入个类别的比例是否与随机期望比例相等
例如

想知道男生与女生在专业选择上是否不同
原理
将已收集分类编码数据的频数(观测频数)与纯碎随机落入表格中每一单元格的预期频数相比较,确定观测频数是否显著的异于预期频数。
计算卡方值需要加入列合计计数和行合计计数,也就是列联表,这种分析检验的是一个变量的一个类别中包括的对象数是否视另一个变量而定

以心理学男生为例,给定整个样本中的男生人数和心理学专业人数,可以预期样本中会随机包括多少心理学男生

即男生总人数除以整个样本容量,心理学专业总人数除以样本总人数,两个比例相乘,乘以样本总人数。其他单元格同理

比较预期值和观测值计算卡方统计量

- 卡方独立性检验的自由度
R是列联表的行数,C是列数