人工智能/模式识别/机器学习精华专题机器学习与数据挖掘Machine Learning & Recommendation & NLP & DL

推荐系统实战之FM(Factorization Machine)

2019-03-27  本文已影响0人  王同学死磕技术

笔者在之前的文章中介绍过使用keras搭建一个基于矩阵分解的推荐系统,而那篇文章所介绍的方法可能只是一个庞大推荐系统中的一小环节。而对于工业级别的推荐系统,面对极其庞大的产品种类数量,一步就输出符合用户心意的产品可能够呛,最好的方式应该是从巨大的产品类别之中粗筛出一些靠谱的待推荐产品,然后再从粗筛的产品中精挑细选出要推荐给用户的最终产品

工业级别的推荐系统简介

工业级别的推荐系统的架构图如下图所示,大致分为两个阶段:

而接下来我要介绍的FM(Factorization Machine)算法,不仅在召回阶段有用武之地,在排序阶段也是很拿得出手的推荐模型。

FM(Factorization Machine)算法简介

Factorization Machine的中文叫因子分解机,FM算法的最强特点就是考虑到了特征的二阶组合——即特征两两组合形成一个新的特征。在产品推荐,CTR预估等任务中,特征相互组合很可能会得到一个特别强的新特征。接下来我们从FM算法的公式来了解一下此算法的精髓:
y = w_0 + \sum_{i=1}^{n}w_ix_i + \sum_{i=1}^{n} \sum_{i=j+1}^{n} <v_i,v_j>x_ix_j
如果我们单看FM算法的前面一部分:y = w_0 + \sum_{i=1}^{n}w_ix_i ,这不就是一个Logistics回归模型吗,确实没错,FM算法的前半部分就是Logistics回归,算法的后半部分才体现出FM的特征组合的思想:

通过下图我们可以将FM算法的公式转化为:

FM算法的改写
模型训练

结语

笔者之前也介绍过GBDT+ LRWide and deep等推荐算法,这次介绍的FM算法也是推荐算法中比较常用的算法,他们都有一个共同的特点——就是这些算法都在寻找特征之间的组合关联,从而实现推荐算法性能的提升。万事万物都存在联系,确实只有算法能够洞察事物(特征)之间联系,才有可能做出更精确的推荐决策。

参考文献

https://zhuanlan.zhihu.com/p/58160982
https://github.com/Hourout/CTR-keras

上一篇下一篇

猜你喜欢

热点阅读