生信星球培训第七十六期

学习小组Day6-叶子

2020-08-20  本文已影响0人  小春卷丫丫

文/叶子

以下内容均来自生信星球,本节课思维导图如下:

一、安装和加载R包

安装加载三部曲:

options("repos"=c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
install.packages("dplyr")
library(dplyr)

二、dplyr五个基础函数

1.mutate(),新增列

2.select(),按列筛选

3.filter(),筛选行

4.arrange(),按某1列或某几列对整个表格进行排序

5.summerise(),汇总

三、dplyr两个实用技能

1.管道操作 %>% (cmd/ctr + shift + M)

2.count统计某列的unique值

四、dplyr处理数据关系

1.內连

inner_join,取交集

2.左连

left_join

3.全连

full_join

4.半连接

返回能够与y表匹配的x表所有记录semi_join

5.反连接

返回无法与y表匹配的x表的所记录anti_join

6.简单合并

在相当于base包里的cbind()函数和rbind()函数;注意,bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数

五、反思

1.我没有安装成功dplyr包

我安装的是R4.0.2和R Studio,安装dplyr包的时候出现了下面的warning:WARNING: Rtools is required to build R packages but is not currently installed. Please download and install the appropriate version of Rtools before proceeding,昨天没有学习,今早才学习,还没有解决。

上一篇下一篇

猜你喜欢

热点阅读