Spark流式计算

spark 内存模型以及存储

2020-02-28  本文已影响0人  loukey_j

spark 内存模型以及存储

参考原文https://www.cnblogs.com/qingyunzong/p/8955141.html

内存模型

堆内内存 & 堆外内存

RDD存储

  1. 持久化工作会交给spark的 BlockManager进行处理,BlockManager 是一个Master/Slaver架构,Master运行在Dirver端,Slaver运行在 Executor 端。
  2. RDD的每一个分区经过处理后都对应一个 Block BlockId 的格式为 rdd_RDD-ID_PARTITION-ID 。
  3. Master 负责整个 Spark 应用程序的 Block 的元数据信息的管理和维护,而 Slave 需要将 Block 的更新等状态上报到 Master,同时接收 Master 的命令,例如新增或删除一个 RDD。
上一篇下一篇

猜你喜欢

热点阅读