生信星球培训第五期

第16章 使用purrr实现迭代

2018-11-30  本文已影响0人  李其龙_ec81

16.1 简介

减少重复代码的方式一个是前面所提及的function功能一个是进行迭代计算
关于减少重复代码的好处我就不细谈了,书上已经写得非常清楚了。

for循环

for循环主要应用的索引
这个索引我认为就是位置,就跟目录页的书页号一样!

每个 for 循环都包括 3 个部分。

带着做一个练习题吧
Compute the mean of every column in mtcars

str(mtcars)
'data.frame':   32 obs. of  11 variables:
 $ mpg : num  21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
 $ cyl : num  6 6 4 6 8 6 8 4 4 6 ...
 $ disp: num  160 160 108 258 360 ...
 $ hp  : num  110 110 93 110 175 105 245 62 95 123 ...
 $ drat: num  3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
 $ wt  : num  2.62 2.88 2.32 3.21 3.44 ...
 $ qsec: num  16.5 17 18.6 19.4 17 ...
 $ vs  : num  0 0 1 1 0 1 0 1 1 1 ...
 $ am  : num  1 1 1 0 0 0 0 0 0 0 ...
 $ gear: num  4 4 4 3 3 3 3 4 4 4 ...
 $ carb: num  4 4 1 1 2 1 4 2 2 4 ...

head(mtcars)
                   mpg cyl disp  hp drat    wt  qsec
Mazda RX4         21.0   6  160 110 3.90 2.620 16.46
Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02
Datsun 710        22.8   4  108  93 3.85 2.320 18.61
Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44
Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02
Valiant           18.1   6  225 105 2.76 3.460 20.22
                  vs am gear carb
Mazda RX4          0  1    4    4
Mazda RX4 Wag      0  1    4    4
Datsun 710         1  1    4    1
Hornet 4 Drive     1  0    3    1
Hornet Sportabout  0  0    3    2
Valiant            1  0    3    1

output <- vector("double", ncol(mtcars))
names(output) <- names(mtcars)
for (i in names(mtcars)) {**这块要注意 如果你用seq_along返回的是带字符型数值的数据 不能计算哦!**
  output[i] <- mean(mtcars[[i]])
}
output
# 

for循环变体
修改现有对象(观测值)

df <- tibble(
  a = rnorm(10),
  b = rnorm(10),
  c = rnorm(10),
  d = rnorm(10)
)
rescale01 <- function(x) {
  rng <- range(x, na.rm = TRUE)
  (x - rng[1]) / (rng[2] - rng[1])
}

df$a <- rescale01(df$a)
df$b <- rescale01(df$b)
df$c <- rescale01(df$c)
df$d <- rescale01(df$d)

for (i in seq_along(df)) {
  df[[i]] <- rescale01(df[[i]])
}

练习1中读取CSV文件 在批量提取测序数据的相同基因的表达值时用的到

df <- vector("list", length(files))
for (fname in seq_along(files)) {
  df[[i]] <- read_csv(files[[i]])
}
df <- bind_rows(df)

for循环与函数式编程

重点说一下apply(),lapply(),tapply()等函数

apply(df,2,mean)  #其中的2表示列 具体解释如下:给出将应用该函数的下标的向量。 例如,矩阵1表示行,2表示列,c(1,2)表示行和列。 其中X命名为dimnames,它可以是选择维名称的字符向量。
等价于
 output <- vector("double", length(df))
  for (i in seq_along(df)) {
    output[i] <- mean(df[[i]])
  }
  output
> lapply(df, mean)
$`a`
[1] -0.4432281

$b
[1] -0.1124617

$c
[1] 0.2448539

$d
[1] -0.03413569
class(lapply(df,mean))
[1] "list"
class(sapply(x, mean))

https://www.zhihu.com/question/39843392

上一篇下一篇

猜你喜欢

热点阅读