SAS如何产生新变量

2020-03-03  本文已影响0人  3between7

这一节我学的是SAS如何产生新变量,其中涉及到了很多细节,让我不紧翻起了🙄,emmmmm,算了,还是老实的做笔记吧。

利用表达式或函数直接产生新变量

变量名=表达式或函数 ;

注意若变量名是已有变量,表示用新值代替原有值,表达式的范围很广,常见的运算符如下:

sas中常见的运算符.jpg

注意SAS中,不等于符是“^=”不是“!=”,新变量要放在“input”和“cards”之间。另外,如果使用比较运算,SAS会根据比较的结果产生0和1。

日期常量要写成“日月年”d这种格式,月是英文的前三个字母。

利用if-then语句产生新变量

if 表达式 then 新变量= ... ; else 新变量= ... ;

利用retain语句和累加语句产生新变量

SAS读取数据时有一特点,就是有遗忘症,它每读完一条观测返回到data语句的时候,会忘掉刚才读取的值,因此若想实现累加效果,需要用到retain语句或者累加语句。

retain 变量1 <初始值> 变量2 <初始值> ...... ;

它的作用是生成一个变量,指定它的初始值,并保留该变量每次计算的结果,若没有指定初始值,默认为缺失值。

变量+表达式

它的作用时产生一个累加的变量值,注意是没有左边的“变量=”部分,直接写右边的表达式,它的默认值为0。另外,累加语句表达式中第一个出现的变量就是新产生的变量名。

利用do循环语句产生新变量

do 变量=初始值 to 最终值 <by 增加值> ;
SAS语句 ;
output ;
end ;

do语句适用于有规律的变量,比如1~12月。初始值、最终值、增加量可以是数值,也可以是字符。若没有增加值,则默认为1。下面是几个常见的do 循环语句的格式:


do循环语句的格式.png

指定新变量的类型与长度

新变量是需要提前指定与之对应的变量类型和长度,SAS中主要是用length语句,它的格式如下:

length 变量1 <$> 长度1 变量2 <$> 长度2 ... ;

如果新变量是字符型,需要加上"$"符号,数值型变量的长度可以指定3~8,字符型变量的长度则可以指定1~32767。另外,length语句一定要在新变量产生之前就设定好,否则不起作用。

需要特别注意:SAS中,字符型变量的长度是由第一个遇到的值得长度决定的,而且字符变量一旦产生,它的长度就无法改变。举例说明:

forEx.png

在左例中,由于事先未指定lx2的长度,而且lx2第一个遇到的值是“无效”,所以它的长度就固定在了4,因此最后打印出来的lx2列也只能有2个汉字。

上一篇下一篇

猜你喜欢

热点阅读