T2.4-SPSS 数据预处理

2016-08-23 本文已影响112人罗尹伊

Data->Sort Cases

按特定变量值排列Case

“把班上所有同学按成绩排名”

Data->Transpose

转置：行列互换

可选择其中的一列作为变量名（SPSS的一列表示一个变量，一行表示一个Case）

Data->Split Files

按照变量值对数据进行分组（不会真的拆分文件，只是将数据进行分组）

“把男生女生的成绩拆分开来”

Data->Merge Files

Add Cases 纵向合并：2个文件的变量完全一致，增加Case而已

把B班同学的语数英成绩导入到A班同学的语数英成绩表格里

Add Variables 横向合并：2个文件的Case完全一致（由同一批人完成），增加新的变量

把班上同学的地理成绩导到语数英成绩的文件中

Data->Aggregate

汇总：先按特定变量把数据分类，再求分类各组的统计值

生成新的数据文件 AGGR.sav

求男生女生的数学和英文成绩的Mean,SD,Max, Min

（选择性别为分类变量，数学成绩、英文成绩为汇总变量）

Data->Weight Cases

如果在一个样本中女性比例过高，可能需要给予女性数据较低的权重值，以抵消它们比例过高引起的影响

在进行频数分布分析时（列联表、交叉表），已知单元格频数，要进行卡方检验，也需要以加权方式处理数据

在当前数据文件中如果存在一个表明相同变量值出现频数的变量，应该把它定义为加权变量

1. 加权变量中含有0、负数、缺失值的Case将被排除在分析外

2. 分数值有效

3. 一旦对数据进行了加权处理，接下来所有的分析过程中加权都有效，直到页面关闭或重新加权

Transform->Rank Cases

求某个变量值的秩（保存为新变量，不改变Case顺序）

“求班上所有同学的排名”

可以分别输出男生、女生的排名

Transform->Count

“求20门课中每个同学一共选了几门课”

每门课选中则数值为1，让20门课对应的20个变量参与计数，生成新变量 mathcrs

可设置条件 if（这个学生还没毕业，就统计一下它选修了几门课）

Transform->Recode

多用于将“定距变量”重新编码为“定序变量”

“把所有同学按照成绩高低分成优、良、差3个层级”

Transform->Automatic Recode

将数值型（含非连续整数）变量转换为连续整数（EX 表示因子水平、人数）

将字符型变量转换为连续整数（EX 非连续数值无法处理）

Transform->Compute

根据现有若干个变量生成一个新的变量

平均进步成绩=（期末语文成绩-期中语文成绩）+（...）/N

Utilities->Define Sets

变量太多时，可以将不常用的变量遮蔽，将常用的变量定义为一个变量集

Utilities->Use Sets

调用已定义的变量集

T2.4-SPSS 数据预处理

T2.4-SPSS 数据预处理

猜你喜欢

热点阅读