DeepFM

2018-08-11  本文已影响242人  山的那边是什么_

1.背景

这篇论文来自哈工大&华为诺亚方舟实验室,主要关注如何学习user behavior背后的组合特征(feature interactions),从而最大化推荐系统的CTR。但目前的方法容易得到low-或者high-order interactions。因此这篇论文提出构建一个端到端的可以同时突出低阶和高阶feature interactions的学习模型DeepFM。DeepFM是一个新的神经网络框架,结合了FM在推荐中的优势和深度学习在特征学习中的优势。

2.原理

2.1 网络结构图


DeepFM包含两部分:FM部分和deep部分,这两部分共享同样的输入。
模型方程:


2.2 FM 部分

2.2.1 网络结构


FM 输入是field特征,每个field可能是one-hot 特征 或者是连续特征。FM 是在LR的基础上,增加了交叉特征,同时对每个交叉特征定义了一个隐藏向量,用来刻画交叉特征的重要程度。
模型方程



V_i 是 field_i 的 k 维隐藏向量。

2.3 deep部分

2.2.1网络结构


可以看着是这是一个全链接的前馈神经网络,用来学习高维的交叉特征。

2.2.2 embedding层设计

网络结构



embedding层的设计:
(1)对于不同长度的输入field向量,得到的embedding长度都是k;
(2)FM中的隐含向量V现在作为神经网络的权重,被学习来压缩输入field向量到embedding向量。
embedding层的输出是m个field对应的e向量,传入DNN,最后得到一个稠密实值向量,经过一个sigmoid函数得到预测的CTR。

2.3优点

  1. FM 学习了低维的交叉特征,DNN 学习了 高维的交叉特征。
  2. 相对Wide & Deep算法不需手工构建输入特征。


2.4 实验结果

3.参考文献

  1. https://zhuanlan.zhihu.com/p/27999355
  2. 论文地址:https://arxiv.org/pdf/1703.04247.pdf
上一篇下一篇

猜你喜欢

热点阅读