数据科学与R语言

R - 几种数据集筛选的速度

2018-08-24  本文已影响0人  XuXiaolu

用了一份很大的数据集,进行条件筛选:

t0 = Sys.time()
cprv_GM[cprv_GM$is_turbo == '非增压',]  
Sys.time() - t0  # Time difference of 34.91563 secs
t0 = Sys.time()
filter(cprv_GM, is_turbo == '非增压') 
Sys.time() - t0  # Time difference of 35.17037 secs
t0 = Sys.time()
subset(cprv_GM, is_turbo == '非增压') 
Sys.time() - t0  # Time difference of 34.67368 secs

结语:

其实三种方法差距并不大,但还建议优先选择subset的方法。

上一篇 下一篇

猜你喜欢

热点阅读