dplyr包

2022-03-07  本文已影响0人  801ca16edefa

1. dplyr简介

dplyr是R语言的数据分析包,能对dataframe类型的数据做很方便的数据处理和分析操作。d代表dataframe - plyr是英文钳子plier的谐音.

dplyr如同R的大多数包,都是函数式编程。有点类似于流水线,每个函数就是一个车间,多个车间共同完成一个生产(数据分析)任务。

而在dplyr中,就有一个管道符 %>% ,符号左侧表示数据的输入,右侧表示下游数据处理环节。

dplyr是R中专门用于数据处理的包。更具体功能包括:

•select() 从数据中选择列

•filter() 数据行的子集

•group_by()汇总数据

•summarise()汇总数据(计算汇总统计信息)

•arrange() 排序数据

mutate() 创建新变量

2. dplyr常用函数

2.1 arrange


也可以写成下面的形式: aapl %>% arrange(-Volume)

2.2 Select

排除3列 aapl %>% select(-c("Open", "High", "Low"))

2.3 Filter

aapl %>% filter((Close>=150) & (Close>Open))

2.4 Mutate(重点)

aapl %>% mutate(n=row_number())

注:转自知乎(HiDadeng)

上一篇 下一篇

猜你喜欢

热点阅读