Spark GraphX

2017-07-12  本文已影响241人  raincoffee

Spark GraphX

GraphX简介

分布式图计算处理技术介绍

下面分别从图数据模型,图数据分割,图数据存储几个方面对常见的图数据分布与并行处理技术进行一个简单的介绍。

1. 属性图

Graphx的数据处理模型就是属性图。

属性图是由带有属性信息的节点和边构成的图,这些属性主要用来描述节点和边的特征。一个属性图,主要由定点和边构成,它具体包括:

2. 图数据的存储和划分

图存储有很多种,包括邻接矩阵,邻接表,十字链表。spark中采用的是机遇RDD的存储与设计。

分割:

类型:

3. Pregel计算模型

4. GraphX图计算框架实现分析

加载和构建

存储和分割

graphx采用定点分割的方法对图数据进行分割,旨在减少通信和存储代价。所谓定点分割分割就是图的彼岸分散在各个节点。而顶点则会跨界点存在。

目前有一下分割策略:

上一篇下一篇

猜你喜欢

热点阅读