生信星球培训第四十期

学习小组day6笔记-蒋1xu

2020-03-04  本文已影响0人  蒋1Xu

镜像设置

  1. 编辑文件file.edit('~/.Rprofile')
  2. 设置镜像options("repos"=c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))清华源
    options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
    中科大源
    保存重启
  3. 查询 options()repos 或者options()BioC_mirror

安装加载

install.packages("dplyr")
library(dplyr)
install.packages(“包”)/BiocManager::install(“包”)。取决于你要安装的包存在于CRAN网站还是Biocductor

dplyr的五个基础函数

mutate(test, new= Sepal.Length*Sepal.Width)
#新建列
select(test,1)
#按列号筛选第一列
select(test,c(1,5))
#筛选第1,5列
select(test,Sepal.Length)
#按列名筛选
select(test,Petal.Length,Petal.Width)
vars<-c("Petal.Length","Petal.Width")
select(test,one_of(vars))
#筛选这两列中所有的向量
filter(test, Species=="setosa")
#筛选行
filter(test, Species=="setosa"&Sepal.Length>5)
#筛选行,并且向量大于5
filter(test, Species%in%c("setosa","versicolor"))
#筛选这两行,并不是行名哦
arrange(test,Sepal.Length)
#按这一列大小排序,从小到大
arrange(test,desc(Sepal.Length))
#desc来从大到小
summarise(test, mean(Sepal.Length), sd(Sepal.Length))
#计算这列的平均值和标准差
summarise(group_by(test, Species), mean(Sepal.Length), sd(Sepal.Length))
#按照species来分组,计算每组SL的平均数和标准差

dplyr两个实用技能

  1. 管道操作 %>% (cmd/ctr+shift+m)
    test %>%
    group_by(Species)%>%
    summarise(mean(Sepal.Length), sd(Sepal.Length))
  2. count统计某列的unique值
    count(test,Species)

dplyr处理关系数据

上一篇 下一篇

猜你喜欢

热点阅读