R语言学习

R014 变量处理常用函数

2020-08-14  本文已影响0人  caoqiansheng
1.变量转换
2.变量的重命名
4.变量的缺失值
> x <- seq(1,30,2)
> x
 [1]  1  3  5  7  9 11 13 15 17 19 21 23 25 27 29
> x[x>=20] <- NA
> x
 [1]  1  3  5  7  9 11 13 15 17 19 NA NA NA NA NA
> y <- na.omit(x)
> y
 [1]  1  3  5  7  9 11 13 15 17 19
attr(,"na.action")
[1] 11 12 13 14 15
attr(,"class")
[1] "omit"
> sum(y)
 [1] 100
> sum(x,na.rm = T)
[1] 100
4.向量处理

length(x):x中元素的个数
dim(x):查看变量的维数;重新设置的维数,例如dim(x)=c(3,2)
dimnames(x):重新设置对象的名称
nrow(x):行的个数
ncol(x):列的个数
class(x):得到或设置x的类;class(x)<-c(3,2)
unclass(x):删除x的类
attr(x,which):得到或设置x的属性which
attributes(obj):得到或设置obj的属性列表
fix,edit:对数据框数据进行表格形式的编辑

5.数据选取和操作

which.max(x):返回x中最大元素的指标
which.min(x):返回x中最小元素的指标
rev(x):翻转x中所有的元素
sort(x):升序排列x中的元素;降序排列使用:rev(sort(x))
cut(x,breaks):将x分割成为几段(或因子);breaks为段数或分割点向量
match(x,y):返回一个和x长度相同且和y中元素相等的向量不等则返回NA
which(x==a):如果比较操作为真(TRUE),返回向量x的指针
choose(n,k):组合数的计算
na.omit(x):去除缺失值(NA)(去除相关行如果x为矩阵或数据框)
na.fail(x):返回错误信息,如果x包含至少一个NA
unique(x):如果x为向量或数据框,返回唯一值
table(x):返回一个由x不同值个数组成的表格(通常用于整数或因子),即频数表
subset(x,...):根据条件(...选取x中元素,如x$V1<10);如果x为数据框,选项select使用负号给出保留 或去除的变量 subset(x, subset, select, drop = FALSE, ...)
sample(x,size):不放回的随即在向量x中抽取size个元素,选项replace=TRUE允许放回抽取
prop.table(x,margin=):根据margin使用分数表示表格,wumargin时,所有元素和为

6.R数据的创建与索引
6.1. 向量的操作

c(...),为concatenate的缩写,向量的创建
from:to :产生一个序列,":"有较高的优先级;1:4+1得到"2,3,4,5"
seq() 产生一个向量序列,seq(from = 1, to = 1, by = ((to - from)/(length.out - 1)),length.out = NULL, along.with = NULL, ...)
rep() 重复一个对象,rep(x,times),x是要重复的对象(例如向量c(1,2,3)),times为对象中每个元素重复的次数,如times=c(9,7,3)就是将x向量的1重复9次,2重复7次,3重复3次。

6.2. 数组(包含矩阵、向量)创建

matrix(...):创立矩阵
array(x,dim=...):产生由x组成的数组
data.frame(...):创建数据框,变量可能被命名或未被命名
list(...):创建一个由变量组成的列表,变量可能被命名;
factor(x,levels=) 把向量x编码称为因子
rbind(...)以行的形式组合矩阵,数据框,或其它
cbind(...)以列的方式组合,其他同rbind()

6.3. 数据切割和分离
6.4. R数学函数
6.5.R字符操作

str_c(..., sep = "", collapse = NULL):转化为字符后连接向量;seq=为分割界限(一个空格为默认);选择collapse=可以分 割"collapse"结果
str_sub(string, start = 1L, end = -1L) :提取字符向量的子字段;
str_to_lower(x):转化为lowercase
str_to_upper(x):转化为uppercase
x%in%table:table中匹配x元素位置组成的向量,返回值为逻辑值
str_match(string, pattern):pattern匹配字符,并返回对应的字符string
str_extract: 从字符串中提取匹配字符
str_extract(shopping_list, "\d") # 提取数字 #提取匹配模式的第一个字符串
str_extract(shopping_list, "[a-z]+") #提取字母
str_detect(string, pattern) :检测函数,用于检测字符串中是否存在某种匹配模式
str_detect(val, "^a"):检查字符串向量,是否以a为开头
nchar(x):字符的个数

上一篇下一篇

猜你喜欢

热点阅读