干货!一文汇总卡方检验分析步骤
一、类型
SPSSAU中卡方检验包括卡方检验、卡方拟合优度、配对卡方、分层卡方。 对于上述四种卡方检验区别如下:
二、卡方检验分析步骤
1.研究目的
卡方检验是研究实际观测值与理论值之间的偏离程度,实际观测值与理论值之间的偏离程度决定卡方值的大小,卡方值越大,偏差越大;卡方值越小,偏差越小,越趋于符合,若两个值完全相等时,卡方值就为0,表明实际观测值与理论值完全符合。
例如:例如研究人员想知道两组学生对于手机品牌的偏好差异情况、不同减肥方式对于减肥帮助情况等,可以使用卡方检验。
2.数据格式
SPSSAU可支持两类数据格式,一种是常规格式(非加权格式),另外一种是加权数据格式。
(1)常规格式
上图为常规格式(即非加权格式),一行代表一个样本,一列代表一个属性,将全部的原始数据信息列出即可。
(2)加权格式
在医学/实验研究时,很多时候只有汇总数据,即带加权项的数据,比如上图中X有2种情况,Y有3个情况,一种有2*3=6种组合,数据信息只有6种组别的汇总项(即加权项),分别是40,10,20,30,20,50;相当于总共有170个样本,如果是使用常规格式(即非加权格式),此时应该有170行;但加权格式则只需要6行即可表示,如上图。
3.上传数据
4.SPSSAU操作步骤
操作步骤分为两步如下说明:
Step1:点击实验/医学研究,模块下的卡方检验
Step2:将左侧数据拖拽到右侧分析框后,点击开始分析如下图
提示:若有加权项拖拽到右下方即可
5.分析
(1)卡方检验分析结果
从分析结果中可以看出p<0.05
(2)差异性说明
从上表可以看出:不同减肥方式样本对于胆固醇水平共1项呈现出显著性(p<0.05),意味着不同减肥方式样本对于胆固醇水平共1项均呈现出差异性。
(3)交叉图
减肥方式和胆固醇水平的交叉图更直观看到三种减肥方式与胆固醇水平的关系。
(4)统计量指标说明
(5)深入指标
卡方检验时有多种指标(SPSSAU提供五类)可表示效应量,可结合数据类型及交叉表格类型综合选择;
第一:如果是2*2表格,建议使用Phi指标;
第二:如果是3*3,或4*4表格,建议使用列联系数;
第三:如果是n*n(n>4)表格,建议使用校正列联系数;
第四:如果是m*n(m不等于n)表格,建议使用Cramer V指标;
第五:如果X或Y中有定序数据,建议使用Lambda指标;
效应量值越大说明差异幅度越大,通常情况下效应量小、中、大的区分临界点分别是: 0.20,0.50和0.80。
(6)多重比较
多重比较,对于此案例简单来说若减肥方式与胆固醇之间存在差异,具体存在哪种差异,需要进行比较。
从上表中可以看到减肥方式与胆固醇之间比较次数为3次。
(7)趋势卡方
6.总结
从上述分析中可知,三类减肥方式与胆固醇水平之间呈现出显著性差异(χ²=7.054,p =0.029 < 0.05),具体通过对比百分比差异可知,药物减肥中有83.33%的样本为胆固醇较低,明显高于饮食(36.36%)和锻炼(33.33%)时胆固醇较低的比例,因而说明药物对于减肥的帮助较高,明显高于饮食和锻炼这两种方式。
三、配对卡方分析步骤
1.研究目的
如果研究配对数据的差异性,例如:对于待诊患者进行两种方法诊断,通过研究判断两种诊断方法是否有差异性,那么可以使用配对卡方。
2.数据格式
配对数据一般是在实验时使用,而且配对数据的特点为:行数一定完全相等并且只有两列。
配对数据一般是在实验时使用,而且配对数据的特点为:行数一定完全相等并且只有两列。如果研究数据的行数不相等,那可能不是配对数据
3.上传数据
4.SPSSAU操作步骤
操作步骤分为两步如下说明:
Step1:点击实验/医学研究,模块下的卡方检验
Step2:将左侧数据拖拽到右侧分析框后,点击开始分析如下图
提示:若有加权项拖拽到右下方即可
5.分析
(1)分析结果
(2)差异性说明
从上表可知,利用配对卡方检验去研究A方法三种结果和B方法三种结果之间的配对差异关系,本次配对对比类别数量大于2(即配对多分类),因而使用Bowker检验进行研究。配对数据之间呈现0.05水平的显著性(chi=8.333,p=0.040<0.05),意味着配对数据间有着明显的差异性
(3)两种方法结果对比
(4)对比图
对比图中可以看到不同项A方法与B方法的百分比。
6.总结
配对对比类别数量为2(即配对四表格),使用McNemar检验进行研究,配对对比类别数量大于2(即配对多分类),使用Bowker检验进行研究。
四、卡方拟合优度检验分析步骤
1.研究目的
如果想研究实际与预期比例之间的比较,比如研究实际性别比例情况,是否与预期性别比例表现一致,则要使用卡方拟合优度检验。(PS:卡方拟合优度检验只针对类别数据)
2.数据格式
(1)普通格式(非加权)
上图为常规格式(即非加权格式),一行代表一个样本,一列代表一个属性,将全部的原始数据信息列出即可。
(2)加权格式
很多时候只有汇总数据,即带加权项的数据,比如上图图中研究项有3种情况,每种情况时样本量分别是40,10,20;相当于总共有70个样本,如果是使用常规格式(即非加权格式),此时应该有70行;但加权格式则只需要3行即可表示。
3.上传数据
4.SPSSAU操作步骤
5.分析
(1)分析结果
此表为卡方拟合优度检验结果,其中P值为0.689。
(2)差异性分析
从上表可以看出:性别全部均没有呈现显著性(p>0.05),意味着接受原假设(原假设:实际分布比例与预期比例一致),即数据分布与预期一致。
(3)图表
上表可以观察出不同性别的实际频数与期望频数的差异,可以看出数据分布与预期大概一致。
6.总结
卡方拟合优度检验研究定类数据的频数分布是否与期望频数保持一致;第一:期望频数默认为完全均匀,可自行设置期望频数;第二:分析是否呈现出显著性(p值小于0.05或0.01);第三:如果呈现出显著性(p<0.05),说明实际频数分布与期望分布具有显著差异;第四:对分析进行总结。
五、分层卡方分析步骤
1.研究目的
若想考虑另一个干扰因素分层项,比如是否吸烟与是否生病的关系时,将性别纳入考虑范畴,则要使用分层卡方。
2.数据格式
加权格式如下图:
针对分层卡方,SPSSAU支持2*2*k结构,即X和Y均为2个类别,k表示分层项的类别数量。
3.上传数据
4.SPSSAU操作步骤
5.分析
(1)汇总表格
(2)比值比OR值估计
上表格中展示合并OR值或Ln(OR值),及其95%置信区间。
(3)比值比齐性检验
从上表可知:Breslow-Day比值比齐性检验并没有呈现出显著性(chi=1.089,p=0.580 >0.05),意味着各层之间关系同质,分层因素之间不存在混杂作用。
(4)条件独立性检验
(5)差异性说明
从上表可知:Cochran–Mantel–Haenszel条件独立性检验呈现出显著性(chi=7.055,p=0.008 <0.05),意味着在考虑干扰因素之后,是否吸烟和是否感冒之间呈现出显著性差异。
6.总结
通常情况下,首先查看‘比值比齐性检验’,如果其呈现出显著性(p 值小于0.05),则说明具有混杂因素,即需要考虑分层项,即分别查看不同分层项下的数据结果。反之如果没有通过‘比值比齐性检验’,即说明没有混杂因素不需要考虑分层项,报告整体的结果即可(包括卡方检验,以及OR值)。
Cochran–Mantel–Haenszel条件独立性用于研究考虑混杂因素(分层项)后,X与Y之间是否还存在着差异关系,相对意义较小。
六、其它
Q1:什么样的数据格式才适合?
如果数据已经进行过初步统计,比如下图中的数据,胆固醇较高并且使用药物减肥的数量为2,胆固醇较低使用锻炼减肥方式的数量为3。这种属于已经统计好的数据,如果希望对此类数据进行卡方检验,则需要对数据格式进行‘改造’。
Q2:多选题卡方检验怎么做?
多选题与其他题项的交叉分析也可采用卡方检验,只是SPSSAU将多选题单独设计为一个方法,方法上依然是卡方检验。
以上就是卡方检验分析步骤汇总。卡方检验是非常实用高效的方法,其它指标说明等请登录官网查看。
更多内容登录SPSSAU官网查看: