学习小组Day6笔记-ww
2021-06-16 本文已影响0人
宿何Leo
Day6-学习R包
安装和加载R包
镜像设置
(引自生信星球教程https://mp.weixin.qq.com/s/XvKb5FjAGM6gYsxTw3tcWw)
自定义CRAN和Bioconductor的下载镜像,这样可以加速R包的下载:
# options函数就是设置R运行过程中的一些选项设置
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #对应清华源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #对应中科大源
# 当然可以换成其他地区的镜像
还可以把这两行代码保存成R配置文件,可以实现在打开Rstudio的时候自动运行设置镜像。
安装R包
install.packages(“包”)
安装CRAN网站上的R包
BiocManager::install(“包”)
安装Biocductor上的R包
加载R包
library(包)
require(包)
例:安装和加载dplyr包:
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
install.packages("dplyr")
library(dplyr)
image.png
dplyr基础应用
新增列
mutate()
按列筛选
select()
按列号筛选
image.png按列名筛选
image.png按行筛选
filter()
按某列或某几列对整个表格进行排序
arrange()
汇总
summarise()
对数据进行汇总操作,结合group_by使用实用性强
image.png
image.png
管道操作
%>%
(cmd/ctrl + shift + M)
统计某列的unique值
count()
dplyr处理关系数据
內连,取交集
inner_join()
左连
left_join()
全连
full_join()
半连接
返回能够与y表匹配的x表所有记录
semi_join()
反连接
返回无法与y表匹配的x表的所有记录
anti_join()
简单合并
bind_rows()
需要两个表格列数相同
bind_cols()
需要两个数据框有相同的行数
相当于base包里的cbind()函数和rbind()函数