生信星球培训第六十七期

学习小组DAY6笔记——Jason

2020-06-24  本文已影响0人  Jason_sxxb

学习R包

思维导图

学习R包

安装和加载

options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) 
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") 
install.packages("dplyr")
library(dplyr)

dplyr的基础函数

  1. mutate(),新增列
  2. select(),按列筛选
    按列号筛选
    按列名筛选
  3. filter(),筛选行
    筛选行
  4. arrange(),按某1列或某几列对
    整个表格进行排序

    从小到大
    从大到小
  5. summarise(),汇总

dplyr的实用技能

  1. 管道操作 %>% (cmd/ctr + shift + M)
  2. count统计某列的unique值

dplyr处理关系数据

新建两个数据框
  1. 內连inner_join,取交集
inner_join(test1,test2,by = "x")
#以test1和test2的相同的x为标准,选取该行。
  1. 左连left_join
left_join(test1, test2, by = 'x') 
#以test1的x为标准,取test2中的x对应的行。
left_join(test2, test1, by = 'x')`
#以test2的x为标准,取test1中的x对应的行。
  1. 全连full_join
full_join(test1,test2,by = "x")
#以test1和test2的x的并集为标准,补全各列
  1. 半连接:返回能够与y表匹配的x表所有记录semi_join
  2. 反连接:返回无法与y表匹配的x表的所记录anti_join
  3. 简单合并
上一篇 下一篇

猜你喜欢

热点阅读