生信星球培训第六十八期

学习小组Day6-格帆

2020-07-05  本文已影响0人  Sherry_cbef

安装和加载R包

1.镜像设置

在R的配置文件 .Rprofile敲入代码

options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #对应清华源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #对应中科大源

保存-重启Rstudio,启动时就会运行.Rprofile中的代码

2.安装

install.packages(“包”)或者BiocManager::install(“包”)
(取决于你要安装的包存在于CRAN网站还是Biocductor)

3.加载

library(包) 或者 require(包)

以dplyr为例学习R包的使用

(一)dplyr基础函数

1.mutate() 新增列

2.select() 按列筛选

(1)按列号筛选
(2)按列名筛选

3.filter()筛选行

4.arrange()按某1列或某几列对整个表格进行排序

5.summarise()汇总

可以算均值、标准差。结合group_by使用实用性强

(二)dplyr实用技能

1.管道操作 %>% (cmd/ctr + shift + M)

数据集传递?

2.count统计某列的unique值

(三)dplyr处理关系数据

1.内连inner_join,取交集

取共有的x,并对应上y和z

2.左连left_join

left_join(test1, test2, by = 'x')

以test1的x数据为准,后面连接上test2的数据

3.全连full_join

以x数据为准,test1后面连接上test2的数据

4.半连接semi_join

返回能够与y表匹配的x表所有记录

5.反连接anti_join

返回无法与y表匹配的x表的所有记录

6.简单合并

注意,bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数

思维导图

屏幕快照 2020-07-05 上午10.19.01.png
上一篇 下一篇

猜你喜欢

热点阅读