Days6-高大石头
2020-01-18 本文已影响0人
高大石头
1.安装&加载R包
首先,设置中国特色社会主义镜像
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
下载R包
#CRAN 的包
install.package(“包”)
#Bioconductor包
if (!requireNamespace("BiocManager", quietly = TRUE))
install.packages("BiocManager")
BiocManager::install("包")
加载R包
方法一:
library("R包")
方法二:
require("R包")
在R的世界里,“包”治百病。
2.dplyr包基础函数实例
test <- iris[c(1:2,51:52,101:102),] #示例数据,iris简化版
#函数1——mutate( ) 新增列
mutate(test, new=Sepal.Length * Sepal.Width)
#函数2——select( ) 按列选择
select(test,c(1,5)) #按列号选择
select(test,Sepal.Length)#按列名选择
select(test, Petal.Length, Petal.Width)
vars <- c("Petal.Length", "Petal.Width")
select(test, one_of(vars))
#函数3——filter( ) 按行选择
filter(test, Species == "setosa")
filter(test, Species == "setosa"&Sepal.Length > 5 )
filter(test, Species %in% c("setosa","versicolor"))
#函数4——arrange( ) 按某一列或几列对数据进行排序
arrange(test, Sepal.Length) #默认从小到大排序
arrange(test, desc(Sepal.Length)) #从大到小排序
#函数5——summarize( )对数据进行汇总
summarise(test, mean(Sepal.Length), sd(Sepal.Length))
summarise(group_by(test, Species),mean(Sepal.Length), sd(Sepal.Length))#结合group_by进行汇总
3.dplyr实用技巧
#管道符 %>%
#count(test, Species) 统计某列的unique值
<dplyr处理数据关系>
inner_join(test1, test2, by = 'x') #按照test1&test2取交集
left_jonn(test1, test2, by="x")
right_join(test1, test2, by = "x")
full_join(test1, test2, by= "x")
返回无法与y表匹配的x表的所记录anti_join( ) #反连接
test1 <- data.frame(x = c(1,2,3,4), y = c(10,20,30,40))
<简单合并>
·bionemarkets
相当于base包里的cbind()函数和rbind()函数;melge()!
biostars 相当于base包里的cbind()函数和rbind()函数