【Graph Embedding】Deep Walk

2019-07-27  本文已影响0人  葡萄肉多

推荐讲解很好的文章
https://zhuanlan.zhihu.com/p/45167021

在推荐系统中的应用

  1. 无现成的网络结构,需要自己构建网络图;
    推荐系统中的数据格式为:

实现说明

(1)原始数据:使用的是一段时间内的购买行为序列(千万量级);

(2)根据行为时间先后顺序,将行为序列数据拆分为 item ---> next_item 节点对格式。用于:构建item的邻居节点集合【构图过程参考:Billion-scale Commodity Embedding for E-commerce Recommendation in Alibaba

(3)构建item的邻居节点集合,python中的networkx模块无法灵活应用大数据量,选择使用“字典”结构存储 {item_M: [item1, item2,...,], itemN: [item2, item5,...,], ...};

(4)由构造的节点集合数据,从每个节点出发,随机游走M步,生成一条序列数据;

(5)获得一条条的随机游走的序列数据;

(6)通过python中的gensim模块训练word2vec模型;

(7)获得每个节点的Embedding向量;

(8)使用Embedding向量做你想做的事情:)

上一篇 下一篇

猜你喜欢

热点阅读