(13)连续变量频率分析
例子:对变量“年龄”进行分析。
打开数据文件,【分析】--【描述统计】--【频率】
选择要分析的变量“周岁年龄”
【统计】【图标】适用于对连续变量的频率分析,不适用于分类变量的频率分析,因此此处需要对【统计】【图标】进行相关设置。
【统计】相关设置
第一区域:百分位值
百分位值主要用于对连续变量数据离散程度的测量,常用的百分位值一般是四分位数。
它是将变量中的数据从小到大排序之后,用三个数据点将数据四等分,于这三个点相应对的值称为四分位值。由于是等分整个数据,这三个数据点分别位于数据的25%(第一四分位数)、50%(第二个四分位数,也就是中位数)、75%(第三四分。位数)。
我们还可以自定义百分位数,如十分位数就是用九个数据点将数据十等分。
第二区域:集中趋势
集中趋势反应了数据向其中心值聚集的程度,是对数据概括性水平的一般性度量,主要通过平均数、中位数、众数来表示。
第三区域:离散趋势
离散趋势反映了数据远离中心值的程度,是衡量集中趋势对整个数据的代表程度。
离散趋势越大,说明集中趋势的代表性越低,即第二区域的平均数、中位数等越不靠谱;反之离散程度接近于0,说明集中趋势代表性越高。
数据的离散程度主要通过范围、标准差、方差来表示
第四区域:分布特征
不常用
我们通常会考量数据是否服从正态分布,偏度和峰度可以反映数据偏离正态分布的程度。
偏度和峰度接近于0,说明数据越符合假定的正态分布。
【图标】相关设置
针对不同类型的数据及分析目的输出不同的图标
条形图:适用于表现数据分布
饼图:适用于表现数据结构
直方图:适用于连续数据
由于连续数据可以测量数据是否服从正态分布,所以在直方图下有勾选“在直方图中显示正态曲线”,勾选后可以一并输出正态曲线图。
说到此处,我们说一下条形图和直方图的差别:
1、条形图用于展现分类数据,直方图用于展现连续数据(如1号.2号....)
2、条形图用条形的长度表示各类别频数的大小,直方图使用面积表示数据大小
直方图数据具有连续性,所以矩形通常是连续排列的,没有间距,条形图表示的是分类数据,一般是有间距隔开的
由于我们分析的是连续变量,重点考量数据的集中趋势和离散趋势,“显示频率表”可选可不选。
输出结果如下: