生信星球培训第六十四期

学习小组Day6笔记-陈冰雪

2020-06-11  本文已影响0人  陈冰雪

安装加载R包

options(BioC_mirror="http://mirrors.tuna.tsinghua.edu.cn/bioconductor/")
options("repos" = c(CRAN="http://mirrors.tuna.tsinghua.edu.cn/CRAN/"))

用options函数设置R运行过程中的镜像
安装dplyr
install.packages("dplyr")
加载dplyr
library(dplyr)
查看dplyr中的指令
ls("package:dplyr")

使用示例数据学习dplyr基础函数

1.png
1.mutate(),用于新增列
test<-(mutate(test,new=Sepal.Length*Sepal.Width)) #新增列名为new。
2.select(),用于按列筛选
select(test,one_of("Sepal.Length","Petal.Length"))
2.png
3.filter()用于筛选行
3.png
4.arrange(),排序。默认从小到大,desc从大到小。
4.png
5.summarise() 用于汇总。
mean():计算平均值
sd():计算方差
group_by( ):分组
5.png

dplyr两个实用技能

1.管道操作 符号 %>% ,快捷键Ctrl+Shift+M
%>%:将左侧准备的数据或表达式,传递给右侧的函数调用或表达式进行运行


6.png

2.coount()统计某列的unique值


7.png

dplyr处理关系数据

1.内连inner_join,取交集,通过相同的元素连接
2.左连left_join,左边的表格连在左边
3.全连full_join
4.半连接semi_join,显示连接表2能与表1匹配的部分
5.反连接anti_join,显示无法匹配的部分
6.简单合并 bind_rows(),合并行,需要两个表格相同列数
bind_cols(),合并列,需要两个表格相同行数。

上一篇下一篇

猜你喜欢

热点阅读