学习小组D6-lz
2020-04-04 本文已影响0人
明眸意海
R包学习
- 安装 install.packages(“包的名称”) CRAN的包或,BiocManager::install(“包的名称”) ,Biocductor的包
- 加载: library(), require()
- 镜像配置 :
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
dplyr package 学习
- mutate(数据集,新的一列列名=。。。),新增列
- select(数据集,X),按列筛选:1.按列号筛选 2 按列名筛选
- filter(数据集,筛选条件):筛选行
- arrange():按某1列或某几列对整个表格进行排序,默认从小到达,可用de
- summarise():汇总,常跟分组函数group_by 联用
- 管道操作 %>% (cmd/ctr + shift + M)
- count:统计某列的各变量出现次数
dplyr处理关系数据
- 內连inner_join(data1,data2,by=共有列名"),取交集
- 左连left_join 第一个data 全保留,保留data2中与data1的交集,其余自动NA填充
- 全连full_join :并集
- 半连接semi_join:返回能够与y表匹配的x表所有记录,即取交集后只保留x的相关信息
- 反连接anti_join:返回无法与y表匹配的x表的所记录(有点拗口,自己去R敲一下代码加深理解吧。。O(∩_∩)O)
- 简单合并:相当于base包里的cbind()函数和rbind()函数;
注意:bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数