R语言学习笔记
4.8 数据排列
使用order函数对数据进行排序,默认是升序,变量前加负号可得到降序排列结果。
4.9 数据集的合并
横向合并两个数据框(数据集):
使用merge()函数,两个数据框可通过一个或多个共有变量进行联结。
total<-merge(dataframeA,dataframeB,by="ID")
使用cbind()进行横向合并两个矩阵或者数据框,并不需要指定一个公共索引。每个对象要有相同的行数。
total<-cbind(A,B)
向数据框添加行(向数据框添加观测,纵向合并两个数据框):
使用rbind()函数进行纵向合并:
total<-rbind(dataframeA,dataframeB)
两个数据框必须拥有相同的变量,如果dataframeA中有dataframeB中没有的变量,需要进行以下处理:
删除dataframeA中多余的变量
在dataframeB中追加变量,并将其值设置为NA
4.10 数据集取子集
4.10.1 选入(保留)变量
数据框中的元素是通过dataframe[row indices, column indices]这样的记号来访问的,结合向量、paste()、利用行列下标以及逗号。
4.10.2 剔除(丢弃)变量
如剔除leadership数据框中的q3和q4:
myvars <- names(leadership) %in% c("q3", "q4")
newdata <- leadership[!myvars]
或者:
如果知道q3和q4是在第8和第9个变量时,可以使用语句:
newdata <- leadership[c(-8,-9)]
或者:
leadership$q3 <- leadership$q4 <- NULL
4.10.3 选入观测
newdata <- leadership[1:3,]
newdata <- leadership[leadership$gender=="M" &
leadership$age > 30,]
attach(leadership)
newdata <- leadership[gender=='M' & age > 30,]
detach(leadership)
4.10.4 subset()函数
4.10.5 随机抽样
sample()函数