学习小组Day6笔记--Yoda
2020-03-11 本文已影响0人
UseeseeU0
学习任务:学习R包
1. 检查镜像
-
检查CRAN镜像是否配置完成:options()$repos
2.在Rstudio中设置自定义CRAN和Bioconductor的下载镜像
# options函数就是设置R运行过程中的一些选项设置
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #对应清华源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #对应中科大源
# 当然可以换成其他地区的镜像
-
设置好之后可以通过:options()$BioC_mirror来检测
3. R包的安装命令
install.packages(“包”)
BiocManager::install(“包”)
4. R包的加载命令
library(包)
require(包)
5. 安装dplyr包
安装成功
-
mutate(),新增列
- select(),按列筛选
- filter()筛选行
- arrange(),按某1列或某几列对整个表格进行排序
- summarise():汇总
6.dplyr两个实用技能
- 管道操作 %>% (cmd/ctr + shift + M)
- count统计某列的unique值
7.dplyr处理关系数据
即将2个表进行连接,注意:不要引入factor
- 內连inner_join,取交集
- 左连left_join
- 全连full_join
- 半连接:返回能够与y表匹配的x表所有记录semi_join
- 反连接:返回无法与y表匹配的x表的所记录anti_join
- 简单合并