数据分析python&机器学习|深度学习

金融网络分析——node embedding

2018-12-19  本文已影响78人  DC学院

不同类型网络 node embedding

1. 节点类型单一,边无属性

在这种类型的网络里,所有的节点类型是相同的,节点之间的边代表着节点与节点的关系,并没有其他属性。

网络类型代表:社交网络

在这种类型的网络里,利用node embedding抽取节点的隐形特征向量能够较好的保存原始数据中的大部分信息。

node embedding大致步骤:

  1. 利用random walk生成节点序列
  2. 找到相似节点
  3. 放进神经网络里进行多分类
  4. 将分类层扔掉,从上一层获取到节点的特征向量


2. 节点两类,边具有属性

在这种类型的网格里,所有的节点分为两类,节点与节点的关系只存在于不同类型的节点之间,边具有特定的属性,例如时间属性,数量属性等。

网络类型代表:金融投资网络

在这种类型的网络里,利用原先的node embedding的方法抽取节点的隐形特征向量可能会损失很大一部分的信息。因此,上面的node embedding的方法不能很好地应用到此类网络中。

投资图的node embedding

《learning node embeddings in interaction graphs》这篇论文研究了如何将投资图这样的二分网络进行node embedding


image.png

如上图所示,该网络是一个用户-股票的二分网络,网络中一种类型的节点是用户(投资者),另一种类型的节点是股票。节点之间的边的属性包括了bors(买进或是卖出),price(价格),amount(数量)等。

对于二分网络,根据时间顺序对两种不同类型的节点分别生成节点序列

预测建模大致步骤:

  1. 对于每一个投资者, 根据时间顺序,生成节点序列,并找到相似节点
  2. 对每一只股票,根据时间顺序生成节点序列,并找到相似节点


  3. 简化节点序列,即抛掉时间和属性
  1. 对简化后的两种类型的节点序别分别作node embedding
  2. 将进行了node embedding之后的投资者特征向量 x 和股票特征向量放在一起,对投资者是否会购买股票进行预测


完整方法

应用于四个不同的数据集,并与其它传统的方法相比较,得到的结果如下:

上一篇下一篇

猜你喜欢

热点阅读