生信星球培训第六十九期

学习小组Day6笔记-朱殊璇

2020-07-08  本文已影响0人  朱殊璇

R包的学习:dplyr包

dplyr包主要用于数据清洗和整理,主要功能有:行选择、列选择、统计汇总、窗口函数、数据框交集等是非常高效、友好的数据处理包。

一、安装dplyr包

1.jpg

二、使用dplyr包:五个基础函数

1、mutate(),新增列

2.jpg

2、select(),筛选列

(1)按列号筛选

3.jpg

(2)按列名筛选

4.jpg

3、filter(),筛选行

5.jpg

4、arrange(),按某1列或某几列对整个表格进行排序

6.jpg

5、summarise(),汇总

7.jpg

三、dplyr的两个实用功能

1、管道操作

8.jpg

2、统计某列的unique值

9.jpg

四、dplyr处理关系数据:将两个表格进行连接

10.jpg

1、inner_join:内连,取交集

11.jpg

2、left_join:左连

12.jpg

3、full_join:全连

13.jpg

4、semi_join:半连接,返回能与y表匹配的x表所有记录

14.jpg

5、anti_join:反连接

15.jpg

6、简单合并:bind_rows();bind_cols()

16.jpg
上一篇 下一篇

猜你喜欢

热点阅读