生信笔记生物信息

R : apply函数族

2019-11-18  本文已影响0人  11的雾

apply函数族

R函数的诸多有趣特性之一,就是它们可以应用到一系列的数据对象上,包括标量、向量、矩阵、数组、数据框和列表。将函数应用于不同的数据对象,主要是借助apply函数族来实现的,该函数族内的函数有apply()、lapply()等多个函数,各个函数的功能相似,需要注意的是,各函数的使用对象和返回结果的形式存在一定的差异,详见下表。

apply函数族中的常用函数

下面分别介绍各个函数的使用。

(1)apply()

·功能:对数组或者矩阵的一个维度使用函数生成列表或者数组、向量。

·使用格式:
apply(x,MARGIN,FUN,…)
其中,x为数据对象,可以是矩阵、数组或者数据框,MARGIN=1表示矩阵行,2表示矩阵列,也可以是c(1,2),FUN表示使用的函数。

·实例:计算矩阵x各行各列的均值。

使用apply函数计算矩阵的均值

>x<-matrix(1:20,ncol=4)
> x
        [,1]  [,2]  [,3]  [,4]
[1,]     1     6     11    16
[2,]     2     7     12    17
[3,]     3     8     13    18
[4,]     4     9     14    19
[5,]     5     10    15    20
> apply(x,1,mean) #计算各行的均值
[1] 8.5  9.5  10.5  11.5  12.5

> apply(x,2,mean) #计算各列的均值
[1] 3  8  13  18

(2)lapply()

·功能:对x的每一个元素运用函数,生成一个与元素个数相同的值列表。
·使用格式:
lapply(x,FUN,…)

其中,x为数据对象,可以是列表、数据框或者向量,FUN表示使用的函数。

·实例:对列表x的每一个元素计算均值。

使用lapply函数计算各子列表的均值

> x <- list(a = 1:5, b = exp(0:3))
> x
$a
[1] 1  2  3  4  5
$b
[1]  1.000000  2.718282  7.389056  20.085537

> lapply(x,mean) #对列表x的每一个元素计算均值
$a
[1] 3
$b
[1] 7.798219

(3)sapply()

·功能:通过对x的每一个元素运用函数,生成一个与元素个数相同的值列表或矩阵。

·使用格式:

sapply(x,FUN,…,simplify=TRUE, USE.NAMES = TRUE)

sapply函数比lapply函数多了一个simplify参数。如果simplify=FALSE,则等价于lapply,否则将lapply输出的list简化为vector或matrix。

·实例:列表list中的元素与数字1~3连接,并以矩阵和列表两种形式输出。

使用sapply函数处理列表的字符串连接

> list=list(c("a", "b", "c"),c("A", "B", "C"))
> list
[[1]]
[1] "a"  "b"  "c"
[[2]]
[1] "A"  "B"  "C"

列表list中的元素与数字1~3连接,输出结果为矩阵

> sapply(list, paste,1:3, simplify=TRUE)
    [,1]   [,2]
[1,] "a 1"  "A 1"
[2,] "b 2"  "B 2"
[3,] "c 3"  "C 3"

#列表list中的元素与数字1~3连接,输出结果为列表
> sapply(list, paste,1:3 ,simplify=F)
[[1]]
[1] "a 1"  "b 2"   "c 3"
[[2]]
[1] "A 1"  "B 2"  "C 3"

(4)tapply()

·功能:对不规则阵列使用向量,即对一组非空值按照一组确定因子进行相应计算。

·使用格式:

tapply(x, INDEX, FUN, …, simplify = TRUE)

其中,x通常是一个向量。INDEX是因子列表,和x长度一样。simplify是逻辑变量,若取值为TRUE(默认值),且函数FUN的计算结果总是为一个标量值,那么函数tapply返回一个数组;若取值为FALSE,则函数tapply的返回值为一个list对象。需要注意的是,当第二个参数INDEX不是因子时,函数tapply()同样有效,因为必要时,R会用as.factor()把参数强制转换成因子。

·实例:计算不同sex对应的height的均值。

使用tapply函数进行分组统计

> height <- c(174, 165, 180, 171, 160)
> sex<-c("F","F","M","F","M")
> tapply(height, sex, mean) #计算不同sex对应的height的均值
    F   M
170  170

(5)mapply()

mapply()函数是sapply的多变量版本。将对多个变量的每个参数运行FUN函数,如有必要,参数将被循环。

·使用格式:

mapply(FUN,…,MoreArgs=NULL,SIMPLIFY=TRUE,USE.NAMES=TRUE)

其中,MoreArgs为FUN函数的其他参数列表。SIMPLIFY是逻辑或者字符串,取值为TRUE时,将结果转换为一个向量、矩阵或者更高维阵列,但不是所有结果都能够转换。

·实例:使用mapply函数重复生成列表list(x=1:2))。

使用mapply函数重复生成列表

#重复生成列表list(x = 1:2)),重复次数times=1:3,结果为一个列表
> mapply(rep, times = 1:3, MoreArgs = list(x = 1:2))
[[1]]
[1]  1  2
[[2]]
[1]  1  2  1  2
[[3]]
[1]  1  2  1  2  1  2
#重复生成列表list(x = 1:2)),重复次数times=c(2,2),结果为一个矩阵
> mapply(rep, times = c(2,2), MoreArgs = list(x = 1:2))
        [,1]  [,2]
[1,]      1     1
[2,]      2     2
[3,]      1     1
[4,]      2     2
上一篇下一篇

猜你喜欢

热点阅读