生物信息随笔

apply 函数家族

2021-06-30  本文已影响0人  南之绿桑

apply 函数的主要优点是我们可以摆脱循环操作。
r 中的应用族包含 apply()、lapply()、sapply()、mapply() 和 tapply()。
最大的问题之一是如何以及何时使用这些功能?
答案很简单,这取决于数据集的结构以及您想要的结果。
下面我们来一一看看如何执行这些功能。

1. apply()

mymatrix<-matrix(1:9,nrow=3)
mymatrix
[,1] [,2] [,3]
[1,]    1    4    7
[2,]    2    5    8
[3,]    3    6    9
#Let’s calculate the row sum.
apply(mymatrix,1,sum)  
[1] 12 15 18
#Let’s calculate the column sum
apply(mymatrix,2,sum)
[1]  6 15 24
#Let’s create NA value in the matrix and see how we can execute the function.
mymatrix[2,3]<-NA
apply(mymatrix,1,sum)
[1] 12 NA 18
#Insert na.rm function in the above code and see the result.
apply(mymatrix,1,sum,na.rm=TRUE)
[1] 12  7 18

2. lapply()

lapply 返回一个与 X 长度相同的列表,其中的每个元素都是将 FUN 应用于 X 的对应元素的结果。

mylist<-list(A=matrix(1:9,nrow=3),B=1:5,C=8)
mylist
$A
     [,1] [,2] [,3]
[1,]    1    4    7
[2,]    2    5    8
[3,]    3    6    9
$B
[1] 1 2 3 4 5
$C
[1] 8
#Let’s calculate the sum of each list.
lapply(mylist,sum)
$A
[1] 45
$B
[1] 15
$C
[1] 8

你可以看到结果是以列表形式保存的。假设你想得到矢量的结果,只需取消列表即可。

unlist(lapply(mylist,sum))

您可以创建自己的函数并传入该函数。
例如,假设您想将每个元素与值 20 相乘,只需使用以下代码。

lapply(mylist,function(x) x*20)

3. sapply()

sapply 是 lapply 的用户友好版本和包装器,默认返回一个向量、矩阵,如果 simplify = "array",则通过应用 simplify2array() 返回一个数组。sapply(x, f, simplify = FALSE, USE.NAMES = FALSE) 与 lapply(x, f) 相同。

sapply(mylist,sum)
A  B  C
45 15  8

4. mapply()

m 代表多变量应用。
让我们举个例子,假设我们有四次重复值 1,我们想要在 4 次重复 1,在 3 次重复 2,在 2 次重复 3,在 1 次重复 4。

mapply(rep,1:4,4:1)
[[1]]
[1] 1 1 1 1
[[2]]
[1] 2 2 2
[[3]]
[1] 3 3
[[4]]
[1] 4

让我们创建一个用户定义的函数,看看 mapply 将如何执行。
假设我们有两个向量 x 和 y。

x<-c(A=20,B=1,C=40)
y<-c(J=430,K=50,L=10)

想象一下,如果您要将这两个向量相加并乘以 2。首先,创建函数并将其传递给 mapply。

simply<-function(u,v){
  (u+v)*2
}
mapply(simply,x,y)
A   B   C
900 102 100
  1. tapply()
tapply(iris$Sepal.Length,iris$Species,max)
setosa versicolor  virginica
  5.8        7.0        7.9

apply:- 在一个数组的边上应用函数。
lapply:- 在一个列表上循环,在每个元素上评估一个函数
sapply:- 与 lapply 相同,但尝试简单的结果。
mapply:- lapply的多变量版本
tapply:- 在一个向量的子集上应用一个函数。

上一篇下一篇

猜你喜欢

热点阅读