关于RDD缓存命令需要导入的包

2017-06-18 本文已影响0人 485b1aca799e

spark操作时候，如果一个数据集需要反复的运算，则考虑将其导入进内存中，使得能够快速的运行。

//在使用缓存命令之前，需要导入一个包

import org.apache.spark.storage.StorageLevel

val x =sc.parallelize(List(1,2,3,4))
x.persist(StorageLevel.MEMORY_AND_DISK)
//默认缓存等级为：MEMORY_ONLY
//将缓存数据集从内存中释放
x.unpersist()

热点阅读

早餐里见世界
谏言：全国的扫黑反腐

08-22浅谈对“天津爆炸事故”的看法和感想
07-04元芳你怎么看下一句
07-03陪伴是最长情的告白下一句
01-21你知道fighting是什么意思？告诉你fighting的意思
06-23深度好文：生命的意义不单是幸福
06-20深度好文：人最怕深交后的陌生

关于RDD缓存命令需要导入的包

猜你喜欢

热点阅读