R语言学习笔记

2019-10-14  本文已影响0人  小红楼上的树影

4.8 数据排列

使用order函数对数据进行排序,默认是升序,变量前加负号可得到降序排列结果。

4.9 数据集的合并

横向合并两个数据框(数据集):

使用merge()函数,两个数据框可通过一个或多个共有变量进行联结。

total<-merge(dataframeA,dataframeB,by="ID")

使用cbind()进行横向合并两个矩阵或者数据框,并不需要指定一个公共索引。每个对象要有相同的行数。

total<-cbind(A,B)

向数据框添加行(向数据框添加观测,纵向合并两个数据框):

使用rbind()函数进行纵向合并:

total<-rbind(dataframeA,dataframeB)

两个数据框必须拥有相同的变量,如果dataframeA中有dataframeB中没有的变量,需要进行以下处理:

删除dataframeA中多余的变量

在dataframeB中追加变量,并将其值设置为NA

4.10 数据集取子集

4.10.1  选入(保留)变量

数据框中的元素是通过dataframe[row indices, column indices]这样的记号来访问的,结合向量、paste()、利用行列下标以及逗号。

4.10.2 剔除(丢弃)变量

如剔除leadership数据框中的q3和q4:

myvars <- names(leadership) %in% c("q3", "q4")

newdata <- leadership[!myvars]

或者:

如果知道q3和q4是在第8和第9个变量时,可以使用语句:

newdata <- leadership[c(-8,-9)]

或者:

leadership$q3 <- leadership$q4 <- NULL

4.10.3 选入观测

newdata <- leadership[1:3,]

newdata <- leadership[leadership$gender=="M" &

leadership$age > 30,]

attach(leadership)

newdata <- leadership[gender=='M' & age > 30,]

detach(leadership)

4.10.4 subset()函数

4.10.5 随机抽样

sample()函数

4.11 SQL语句

上一篇下一篇

猜你喜欢

热点阅读