生信星球培训第八十四期

学习小组Day6笔记-君君

2020-10-18  本文已影响0人  喵喵喵_dadb

R包的学习

R包的安装与加载

1.镜像设置-教程

2.安装

3.加载

so 安装加载流程:

options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) 
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") 
install.packages("dplyr")
library(dplyr)

dplyr包的用法

5个基础函数

  1. mutate()--新增列。
    括号里面去定义新增哪个数据框里面的内容,后用逗号隔开,定义该新函数应该是以何种运算来出现。如:mutate(test,new=ab),那么新的一列就是以ab来计算得到的。
  2. select()--按列筛选。
  1. filter()--筛选行
  2. arrange()--按某1列或某几列对整个表格进行排序。

5.`summarise():汇总(与group_by联合使用更香哦)

group_by(test, Species) # 先按照Species分组,计算每组Sepal.Length的平均值和标准差
summarise(group_by(test, Species),mean(Sepal.Length), sd(Sepal.Length))   

实用技能

  1. 管道操作 %>%(cmd/ctr + shift + M):加载任意一个tidyverse包均可使用。
  2. count统计某列的unique值:count(数据集,列名)。

处理关系数据(将两个表进行连接)

  1. 取交集:inner_join(test1, test2, by = "x")
  2. 左连: left_join(test1, test2, by = 'x')
  3. 全连full_join( test1, test2, by = 'x')
  4. 半连接semi_join(x = test1, y = test2, by = 'x')
  5. 反连接anti_join(x = test2, y = test1, by = 'x')
  6. bind_rows()函数是两个表格列数相同相连接,而bind_cols()函数则是两个数据框有相同的行数
上一篇 下一篇

猜你喜欢

热点阅读