T2.4-SPSS 数据预处理

2016-08-23  本文已影响112人  罗尹伊

Data->Sort Cases

按特定变量值排列Case

“把班上所有同学按成绩排名”

Data->Transpose

转置:行列互换

可选择其中的一列作为变量名(SPSS的一列表示一个变量,一行表示一个Case)

Data->Split Files

按照变量值对数据进行分组(不会真的拆分文件,只是将数据进行分组)

“把男生女生的成绩拆分开来”

Data->Merge Files

Add Cases 纵向合并:2个文件的变量完全一致,增加Case而已

把B班同学的语数英成绩导入到A班同学的语数英成绩表格里

Add Variables 横向合并:2个文件的Case完全一致(由同一批人完成),增加新的变量

把班上同学的地理成绩导到语数英成绩的文件中

Data->Aggregate

汇总:先按特定变量把数据分类,再求分类各组的统计值

生成新的数据文件 AGGR.sav

求男生女生的数学和英文成绩的Mean,SD,Max, Min

(选择性别为分类变量,数学成绩、英文成绩为汇总变量)

Data->Weight Cases

如果在一个样本中女性比例过高,可能需要给予女性数据较低的权重值,以抵消它们比例过高引起的影响

在进行频数分布分析时(列联表、交叉表),已知单元格频数,要进行卡方检验,也需要以加权方式处理数据

在当前数据文件中如果存在一个表明相同变量值出现频数的变量,应该把它定义为加权变量

1. 加权变量中含有0、负数、缺失值的Case将被排除在分析外

2. 分数值有效

3. 一旦对数据进行了加权处理,接下来所有的分析过程中加权都有效,直到页面关闭或重新加权


Transform->Rank Cases

求某个变量值的秩(保存为新变量,不改变Case顺序)

“求班上所有同学的排名”

可以分别输出男生、女生的排名

Transform->Count

“求20门课中每个同学一共选了几门课”

每门课选中则数值为1,让20门课对应的20个变量参与计数,生成新变量 mathcrs

可设置条件 if(这个学生还没毕业,就统计一下它选修了几门课)

Transform->Recode

多用于将“定距变量”重新编码为“定序变量”

“把所有同学按照成绩高低分成优、良、差3个层级”

Transform->Automatic Recode

将数值型(含非连续整数)变量转换为连续整数(EX 表示因子水平、人数)

将字符型变量转换为连续整数(EX 非连续数值无法处理)

Transform->Compute

根据现有若干个变量生成一个新的变量

平均进步成绩=(期末语文成绩-期中语文成绩)+(...)/N

Utilities->Define Sets

变量太多时,可以将不常用的变量遮蔽,将常用的变量定义为一个变量集

Utilities->Use Sets

调用已定义的变量集


T2.4-SPSS 数据预处理 T2.4-SPSS 数据预处理
上一篇下一篇

猜你喜欢

热点阅读