R语言学习

300:R base3-数据框的基本操作,跟SAS对比

2024-01-09  本文已影响0人  SASPRO的打工人生活

以后尽量采用今天这样截图的形式,通过将SAS和R的语法进行对比,这样大家更能直观地看出区别。
一:对数据框进行基本处理,比如数据的筛选

左边为SAS,右边是R,记得粘到R studio运行。SAS对数据处理的形式是多样的,比如筛选数据可以用where和if,但是为了省事,我只采用一种方法。

R对数据的处理形式也是多样的,但是感觉R更丰富一些。

image.png

二:数据集的排序

需要注意的是,如果数据集是根据单个变量进行排序,可以通过order函数和的方式,但是如果需要根据多个变量进行排序,不能classorigSex,Age这样写(或者说我不知道)。

而是通过attach函数实现,对于这个attach,我的个人理解是类似SAS里面的数据集存储在逻辑库里,如果你需要对数据集里面的变量进行处理,你得把这个数据集先读取出来。而attach函数的的作用就是把数据框添加到R的搜索路径中。

image.png

这边需要注意一点是,在SAS中,如果需要根据变量倒序排序,得单独对变量加descending,但是在R中,倒序的函数是decreasing,而且是对多个变量同时进行倒序(目前不知能不能像SAS只对某几个变量倒序),比如说我只想对sex,age排序,然后sex是倒序排序,在R中,目前这样看好像是不行的。

三:去除重复值
看到R在查找和去除重复值方面有这么多功能,显得花里胡哨的,SAS中的dupout类似查找重复值,但是不会显示重复值在第几行。


image.png

四:在数据框里添加变量或者删除变量
上面的keep更合理地解释应该是保存变量,而不是筛选变量。

image.png

上面是对数据框的一些基本操作,了解这些,应该就能对单个数据集进行一些初步的处理了,之后我们开始数据集的拼接合并那些。

上一篇 下一篇

猜你喜欢

热点阅读