Spark GraphX

2017-07-12 本文已影响241人 raincoffee

GraphX简介

下面分别从图数据模型，图数据分割，图数据存储几个方面对常见的图数据分布与并行处理技术进行一个简单的介绍。

Graphx的数据处理模型就是属性图。

属性图是由带有属性信息的节点和边构成的图，这些属性主要用来描述节点和边的特征。一个属性图，主要由定点和边构成，它具体包括：

图存储有很多种，包括邻接矩阵，邻接表，十字链表。spark中采用的是机遇RDD的存储与设计。

分割：

类型：

graphx采用定点分割的方法对图数据进行分割，旨在减少通信和存储代价。所谓定点分割分割就是图的彼岸分散在各个节点。而顶点则会跨界点存在。

目前有一下分割策略：