生信星球培训第四十五期

学习小组Day6笔记——Fish仔

2020-03-21  本文已影响0人  kinder_85a2

学习R包

1.安装和加载R包

1.1.镜像设置

附生信星球教程

1.2.安装

1.3.加载

以安装dplyr为例,安装加载三部曲的命令行为:
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
install.packages("dplyr")
library(dplyr)

以下演示用内置数据集iris的简化版进行
test <- iris[c(1:2,51:52,101:102),]


image.png

2.dplyr五个基础函数

2.1.mutate(),新增列

2.2.select(),按列筛选

2.2.1.按列号筛选

2.2.2.按列名筛选

2.3.filter()筛选行

2.4.arrange(),按某1列或某几列对整个表格进行排序

2.5.summarise():汇总

3.dplyr两个实用技能

3.1.管道操作 %>% (cmd/ctr + shift + M)

即在连续操作中用几句简单的命令进行操作,避免了冗长的命令行
解析

3.2.count统计某列的unique值

4.dplyr处理关系数据

先准备两个表格
test1

4.1.內连inner_join,取交集

4.2.左连left_join

4.3.全连full_join

4.4.半连接:返回能够与y表匹配的x表所有记录semi_join

4.5.反连接:返回无法与y表匹配的x表的所记录anti_join

4.6.简单合并

bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数
先准备三个数据集
test1 <- data.frame(x = c(1,2,3,4), y = c(10,20,30,40))


image.png

test2 <- data.frame(x = c(5,6), y = c(50,60))


image.png
test3 <- data.frame(z = c(100,200,300,400))
image.png
上一篇下一篇

猜你喜欢

热点阅读