生信星球培训第三十三期

Days6-高大石头

2020-01-18  本文已影响0人  高大石头

1.安装&加载R包

首先,设置中国特色社会主义镜像

options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) 
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") 

下载R包

#CRAN 的包
install.package(“包”)
#Bioconductor包
if (!requireNamespace("BiocManager", quietly = TRUE))
    install.packages("BiocManager")

BiocManager::install("包")

加载R包

方法一:
library("R包")
方法二:
require("R包")

在R的世界里,“包”治百病。

2.dplyr包基础函数实例

test <- iris[c(1:2,51:52,101:102),] #示例数据,iris简化版
#函数1——mutate( ) 新增列
mutate(test, new=Sepal.Length * Sepal.Width)

#函数2——select( ) 按列选择
select(test,c(1,5)) #按列号选择
select(test,Sepal.Length)#按列名选择
select(test, Petal.Length, Petal.Width)
vars <- c("Petal.Length", "Petal.Width")
select(test, one_of(vars))

#函数3——filter( ) 按行选择
filter(test, Species == "setosa")
filter(test, Species == "setosa"&Sepal.Length > 5 )
filter(test, Species %in% c("setosa","versicolor"))

#函数4——arrange( ) 按某一列或几列对数据进行排序
arrange(test, Sepal.Length) #默认从小到大排序
arrange(test, desc(Sepal.Length)) #从大到小排序

#函数5——summarize( )对数据进行汇总
summarise(test, mean(Sepal.Length), sd(Sepal.Length))
summarise(group_by(test, Species),mean(Sepal.Length), sd(Sepal.Length))#结合group_by进行汇总

3.dplyr实用技巧

#管道符 %>%
#count(test, Species) 统计某列的unique值 

<dplyr处理数据关系>

inner_join(test1, test2, by = 'x') #按照test1&test2取交集
left_jonn(test1, test2, by="x")
right_join(test1, test2, by = "x")
full_join(test1, test2, by= "x")
返回无法与y表匹配的x表的所记录anti_join( ) #反连接
test1 <- data.frame(x = c(1,2,3,4), y = c(10,20,30,40))
<简单合并>
·bionemarkets
相当于base包里的cbind()函数和rbind()函数;melge()!

biostars 相当于base包里的cbind()函数和rbind()函数

上一篇下一篇

猜你喜欢

热点阅读