Day6——youwanwan39
2020-12-29 本文已影响0人
youwanwan39
安装加载三部曲
options("repos"=c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
install.packages("dplyr"→可换成其他R包的名字)
library(dplyr)
dplyr五个函数
-
mutate()新增列 -
select()按列筛选 -
filter()按行筛选 -
arrange()按某1列或某几列对整个表格进行排序
默认从小到大,arrange(变量,desc(列名))从大到小 -
summarise()汇总
group_by()按xx分组
dplyr两个实用技能
-
管道操作
%>%(cmd/ctr+shift+M)
管道运算符%>%:将一个函数的输出传递给另一个函数作为参数 -
统计某列的unique值
count()
dplyr处理关系数据
- 内连
inner_join(),取交集 - 左连
left_join() - 全连
full_join() - 半连接:返回能够与y表匹配的x表所有记录
semi_join() - 反连接:返回无法与y表匹配的x表所有记录
anti_join() - 简单合并
bind_rows()需要两个表格列数相同
bind_cols()需要两个数据框有相同的行数