apply,lapply,sapply,vapply,tappl

2022-09-22  本文已影响0人  粥粥zz

1.apply()

apply()以数据帧或矩阵作为输入,并以向量、列表或数组的形式给出输出。

> data <- matrix(C<-(1:30),nrow=5)
> data
     [,1] [,2] [,3] [,4] [,5] [,6]
[1,]    1    6   11   16   21   26
[2,]    2    7   12   17   22   27
[3,]    3    8   13   18   23   28
[4,]    4    9   14   19   24   29
[5,]    5   10   15   20   25   30
> apply(data, 2, sum)
[1]  15  40  65  90 115 140
> apply(data, 1, sum)
[1]  81  87  93  99 105
> apply(data, c(1,2), sum)
     [,1] [,2] [,3] [,4] [,5] [,6]
[1,]    1    6   11   16   21   26
[2,]    2    7   12   17   22   27
[3,]    3    8   13   18   23   28
[4,]    4    9   14   19   24   29
[5,]    5   10   15   20   25   30

2.lapply()

  lapply()(代表list apply)与矩阵的apply()函数的用法类似。其对列表对象执行操作,并返回与原始集合长度相同的列表对象。
  lapply()和apply()之间的区别在于输出。lapply()的输出是一个列表。lapply()可以用于其他对象,比如数据帧和列表。

> x <- list(a = 1:10, beta = exp(-3:3), logic = c(TRUE,FALSE,FALSE,TRUE))
> lapply(x, quantile, probs = 1:3/4)
$a
 25%  50%  75% 
3.25 5.50 7.75 

$beta
      25%       50%       75% 
0.2516074 1.0000000 5.0536690 

$logic
25% 50% 75% 
0.0 0.5 1.0 

3.sapply()

sapply()(代表simplified [l]apply)可以将结果整理以向量,矩阵,列表 的形式输出

#以向量输出
> sapply(x, mean)
       a     beta    logic 
5.500000 4.535125 0.500000 
#以矩阵输出
> sapply(x, quantile)
         a        beta logic
0%    1.00  0.04978707   0.0
25%   3.25  0.25160736   0.0
50%   5.50  1.00000000   0.5
75%   7.75  5.05366896   1.0
100% 10.00 20.08553692   1.0
#以列表输出
> sapply(x, seq)
$a
 [1]  1  2  3  4  5  6  7  8  9 10

$beta
[1] 1 2 3 4 5 6 7

$logic
[1] 1 2 3 4

4.vapply()

vapply()与sapply()相似,他可以预先指定的返回值类型。所以它使用起来会更加安全,有的时候会更快
在vapply函数中总是会进行简化,vapply会检测FUN的所有值是否与FUN.VALUE兼容,以使他们具有相同的长度和类型。

> sapply(x, quantile)
         a        beta logic
0%    1.00  0.04978707   0.0
25%   3.25  0.25160736   0.0
50%   5.50  1.00000000   0.5
75%   7.75  5.05366896   1.0
100% 10.00 20.08553692   1.0
> vapply(x, quantile, c(Min. = 0, "1st Qu." = 0, Median = 0, "3rd Qu." = 0, Max. = 0))
            a        beta logic
Min.     1.00  0.04978707   0.0
1st Qu.  3.25  0.25160736   0.0
Median   5.50  1.00000000   0.5
3rd Qu.  7.75  5.05366896   1.0
Max.    10.00 20.08553692   1.0

5.tapply()

tapply()为向量中的每个因子变量根据函数计算一个度量值。

> n <- 17
> fac <- factor(rep_len(1:3, n), levels = 1:5)
> table(fac)
fac
1 2 3 4 5 
6 6 5 0 0 
> tapply(1:n, fac, sum)
 1  2  3  4  5 
51 57 45 NA NA 

6.mapply()

多参数版本的sapply()。第一次计算传入各组向量的第一个元素到FUN,进行结算得到结果;第二次传入各组向量的第二个元素,得到结果;第三次传入各组向量的第三个元素…以此类推。

>      mapply(rep, 1:4, 4:1,SIMPLIFY = FALSE)
[[1]]
[1] 1 1 1 1

[[2]]
[1] 2 2 2

[[3]]
[1] 3 3

[[4]]
[1] 4
上一篇 下一篇

猜你喜欢

热点阅读