2019-07-14
2019-07-15 本文已影响0人
wwang945
[ACL 2019] Neural News Recommendation with Long- and Short-term User Representations
- 新闻推荐,学习用户的两个表示:用户的长期兴趣和短期兴趣
- 其他工作一般都只学习了用户的一种表示
- 长期兴趣表示就是一个固定的user Embedding
- 短期用户表示就是用户最近点击的新闻的表示,通过GRU得到
-
新闻的表示建模如下图,两个级别的Topic Embedding和Title的表示拼接,Title的表示用CNN+Attention得到
news encoder -
然后就是怎么合并两种用户表示了,一种是用长期用户表示初始化短期表示的GRU hidden state,一折是直接拼接两种表示,从实验效果来看,初始化的效果好一点,两个方法具体如下两图
LSTUR-ini
LSTUR-con - 最后通过用户表示与候选news表示做点积得到预测分数
- 主要贡献:提出了一种方法同时学习用户的长期和短期表示
[IJCAI 2019] Deep Session Interest Network for Click-Through Rate Prediction
- 阿里的文章,DIN和DIEN之后的一篇,DSIN
-
本文考虑到一个现象,就是用一个session里面的item一般都是很相似的,不同session的item差异比较大,如下图:
session的差异 -
所以本文提出了一个基于session的CTR预估方法,整体结构如下
Overview - 对于每一个session,用multi-head self-attention建模然后mean pooling得到一个表示
- 然后用Bi-LSTM对多个session的表示建模
- 中间用attention(activation unit)得到两个整体的表示
- 最后与user profile表示、item profile表示拼一起,然后MLP得到最后的预测值
- 主要贡献:提出了一种基于session的CTR预估模型
- 缺点:user没有与item做任何交互,只是最后拼一起了
[KDD 2019] Beyond Personalization: Social Content Recommendation for Creator Equality and Consumer Satisfaction
- 平衡内容创建者平等和内容消费者满意度
- 就是说对长尾用户的内容增加曝光,而又不损害用户满意度
- 主要通过对用户的多级社交网络friends做attention,这样得到用户的个性化表示能增加推荐的准确度和多样性
-
对内容(文档)的建模如下图,通过CNN+attention对word level建模,然后通过BiGRU+attention得到整个文档的表示
architecture -
用户的表示,也就是他的多个多级friends的表示的attention,多个friends通过蒙特卡罗树探索得到,如下图:
social -
用Gini指数来量化不同模型的解决长尾问题的程度,越大的Gini指数说明越少的内容统治了整个市场,实验效果如图:
实验效果 - 主要贡献:提出了内容生产者公平的问题,不能使得用户满意度降低,同时提出了一个模型来解决这个问题。
[KDD 2019] Real-time Attention Based Look-alike Model for Recommender System
- 腾讯的文章,也是解决长尾内容的问题
- 用Look-alike模型,就是对一个item,得到与其有过交互的一些用户当做seed users,然后从seed users出发得到一些相似的其他用户,给这些用户推荐这个item
-
这样的话,只要一个item与其交互过的user数量达到一定量,就能把它推荐给很多用户了, 结构如下图
model structure - 然后通过异步更新seed users的方法使得可以快速在线预测
- 主要贡献:提出了长尾内容问题,并且提出一个解决方法
[WWW 2019] Feature Generation by Convolutional Neural Network for Click-Through Rate Prediction
- 自动特征增广方法
-
通过CNN从原始特征中生成一些新的特征,用来模拟特征工程,来得到更好的效果, 如下图
FGCNN -
具体的,原始特征就是多个Field的Embedding表示的一个矩阵, 然后用CNN在这个矩阵上做卷积,得到生成的人造特征,再与原始特征拼一起来做预测,如下图
overview - 主要贡献:一种新的角度做模型,生成人造特征
- 缺点:特征就还是原来的没有变,相当于多做了一步而已
[KDD 2019] Behavior Sequence Transformer for E-commerce Recommendation in Alibaba
- 用Transformer对用户行为建模,得到预测结果
-
整体结构图如下,就是用transformer对历史item表示和target item一起建模,然后去其他特征的表示拼一起,然后MLP得到最后的预测
overview architecture - 主要贡献:用Transformer结构对用户序列建模
[KDD 2019] Hierarchical Gating Networks for Sequential Recommendation
- 分层门控网络做序列推荐
- 用户兴趣分为长期和短期兴趣,然后短期兴趣其实是很难通过最近交互的items捕捉到
-
本文通过两层的gate机制来对用户的短期兴趣建模,模型结果如下
architecture - 第一层gate按维度对表示做gate,第二层按item对item表示做gate,然后通过average或max聚合得到一个表示
- 最后的预测值通过user与target,gated表示与target以及原始item表示与target的点积求和得到
- 主要贡献:提出了一个新的方法来预测下一个item推荐