医学案例 | 相关分析

2023-09-10  本文已影响0人  spssau

 

一、案例介绍

某医师测量了15名正常成年人的体重(kg)与CT双肾总体积(ml)大小,数据如下表所示。据此试分析两变量是否有关系?其方向与密切程度如何?

二、问题分析

要分析两个定量数据之间是否有关系以及关系的方向和紧密程度,可以使用Pearson相关分析。使用Pearson相关分析,需要满足4个条件。

条件1:两变量均为定量数据。

条件2:两变量之间存在线性关系,通常使用散点图进行检验。

条件3:两变量均没有异常值。

条件4:两变量均符合正态分布。

在本案例中,体重和双肾总体积均为定量数据,满足条件1;条件2-4需要分别进行检验。

三、软件操作及结果解读

(1)线性关系检验

变量之间的线性关系通常使用散点图进行检验。散点图是通过使用两组数据构成的多个坐标点,判断两变量之间是否存在线性关系。将数据上传至SPSSAU系统,在【可视化】模块选择【散点图】,将“双肾总体积”拖拽到右侧“Y定量”分析框中,将“体重”拖拽到右侧“X定量”分析框中,然后点击开始分析,操作如下图:

SPSSAU输出散点图如下:

从散点图可以看出,体重和双肾总体积之间呈现出明显的线性关系,随着体重的增大,双肾总体积也不断增大。所以两变量满足条件2 存在线性关系。

散点图除了查看是否存在线性关系,还可以查看是否存在异常值;不过通过散点图判断异常值具有很强的主观性,比如上图圈出来的点,无法做到准确判断,而Pearson相关系数易受异常值的影响,所以可以选择通过其他方式检验异常值,比如箱线图。

(2)异常值检验

使用箱线图可以直观识别数据的异常值,箱线图由5个点构成,分别是最大观察值、25%分位数(Q1)、中位数、75%分位数(Q3)、最大观察值,最大观察值和最小观察值的定义如下:

最大观察值=Q3+1.5IQR,IQR=Q3-Q1

最小观察值= Q1-1.5IQR,IQR=Q3-Q1

如果数据存在异常值——大于最大观察值或小于最小观察值,SPSSAU将该点以“原点”形式进行展示。

在SPSSAU【可视化】模块,选择【箱线图】,将两变量均拖拽到右侧“分析项(定量)”中,点击开始分析,操作如下图:

SPSSAU输出体重和双肾总体积的箱线图如下:

从箱线图可以看出,体重和双肾总体积两变量均不存在异常值,满足条件3。

若存在异常值,可以通过异常值汇总表格如下图,查看具体异常值个数以及异常值数字,对异常值进行删除等操作。

(3)正态性检验

两变量均需要满足正态性,正态性可以使用多种方式进行检验,比如直方图、P-P如/Q-Q图、峰度/偏度、正态性检验等。本案例选择正态性检验。在SPSSAU【通用方法】模块,选择【正态性检验】,将两变量拖拽到右侧“分析项(定量)”分析框中,然后点击开始分析。操作如下图:

SPSSAU输出正态性检验结果如下:

从上表可知,针对体重、双肾总体积进行正态性检验,样本量为15<50,所以使用Shapiro-Wlik正态性检验结果,具体来看,体重、双肾总体积正态性检验对应p值均大于0.05,未呈现出显著性,说明接受原假设(原假设为数据服从正态分布),即两变量均服从正态分布,满足条件4。

综上所述,本案例数据满足使用Pearson相关分析的条件,可以进行Pearson相关分析。

(4)Pearson相关分析

①相关系数计算

Pearson相关分析使用相关系数描述变量之间的相关关系,Pearson相关系数取值范围为[-1,1],相关系数的绝对值越接近1,说明变量之间相关性越强;绝对值越接近0,相关性越弱。相关系数大于0,代表变量之间存在正相关;相关系数小于0,代表负相关

Pearson相关系数的计算公式如下:

r=rac{sum(X-overline{X})(Y-overline{Y})}{sqrt{sum(X-overline{X})^2}sqrt{sum(Y-overline{Y})^2}}

overline{X}=(43+74+51+…+54)/15=59.53

overline{Y}=(217.22+316.18+…+266.104)/15=266.104

sum(X-overline{X})(Y-overline{Y})=(43-59.53)*(217.22-266.104)+(74-59.53)*(316.18-266.104)+…+(54-59.53)*(252.08-266.104)=6301.038

sqrt{sum(X-overline{X})^2}=2555.733

sqrt{sum(Y-overline{Y})^2}=20270.495

r=rac{6301.038}{sqrt{2555.733}sqrt{20270.495}}=0.8754

所以,手工计算得到体重和双肾总体积的Pearson相关系数为0.8754,说明两变量之间存在高度正相关关系。

接下来,介绍如何使用软件快速计算相关系数。

②软件计算

在SPSSAU【通用方法】模块,选择【相关分析】,将“体重”拖拽到右侧“分析项X”分析框中,将“双肾总体积”拖拽到右侧“分析项Y”分析框中,选择“Pearson相关系数”,然后点击开始分析,操作如下图:

SPSSAU输出Pearson相关分析结果如下:

从上表可以看出,体重和双肾总体积之间相关系数为0.8754,p<0.0,5,说明两变量存在显著正相关关系,即体重与双肾总体积之间存在高度正相关关系。

四、结论

本案例研究体重与双肾总体积之间的关系情况,经检验,两变量均满足Pearson相关分析需要满足的4个条件。使用Pearson相关分析得到,体重与双肾总体积之间的相关系数为0.8754,p<0.05,说明两变量之间存在显著正相关关系,即体重越大,双肾总体积越大。

五、知识小贴士

数据不满足正态性怎么办?

经过正态性检验,如果两个变量不符合正态分布,有以下三种选择:

①使用Spearman相关系数进行分析。

②对不服从正态分布的变量进行数据变换,如取对数等操作,对变换后的数据再进行检验。

③继续使用Pearson相关分析,如果对数据要求不是太严格,Pearson相关系数对不服从正态分布的数据具有一定抗性,可继续使用。

上一篇下一篇

猜你喜欢

热点阅读