学习小组Day6笔记-陈冰雪
2020-06-11 本文已影响0人
陈冰雪
安装加载R包
options(BioC_mirror="http://mirrors.tuna.tsinghua.edu.cn/bioconductor/")
options("repos" = c(CRAN="http://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
用options函数设置R运行过程中的镜像
安装dplyr
install.packages("dplyr")
加载dplyr
library(dplyr)
查看dplyr中的指令
ls("package:dplyr")
使用示例数据学习dplyr基础函数

1.mutate(),用于新增列
test<-(mutate(test,new=Sepal.Length*Sepal.Width))
#新增列名为new。2.select(),用于按列筛选
select(test,one_of("Sepal.Length","Petal.Length"))

3.filter()用于筛选行

4.arrange(),排序。默认从小到大,desc从大到小。

5.summarise() 用于汇总。
mean():计算平均值
sd():计算方差
group_by( ):分组

dplyr两个实用技能
1.管道操作 符号 %>% ,快捷键Ctrl+Shift+M
%>%:将左侧准备的数据或表达式,传递给右侧的函数调用或表达式进行运行

2.coount()统计某列的unique值

dplyr处理关系数据
1.内连inner_join,取交集,通过相同的元素连接
2.左连left_join,左边的表格连在左边
3.全连full_join
4.半连接semi_join,显示连接表2能与表1匹配的部分
5.反连接anti_join,显示无法匹配的部分
6.简单合并 bind_rows(),合并行,需要两个表格相同列数
bind_cols(),合并列,需要两个表格相同行数。