新闻推荐(11):Fine-grained Interest M
2020-10-15 本文已影响0人
阿瑟_TJRS
前言
-
ACL2020的一篇长文,主要介绍基于匹配思想进行新闻推荐改进的工作
-
该团队相关工作详见个人专题《新闻推荐研究》
-
背景/问题:
- 新闻推荐的核心是用户兴趣与候选新闻的匹配问题(matching)
- 重要的新闻语义特征也隐含在不同粒度(granularity)的文本段落中。
- 当前研究把用户表征成单一向量与候选新闻进行匹配,可能损失很多推荐的细粒度特征
-
主要工作/关键创新:
- 表征方面:提出多层级的用户/新闻表征,使用层级扩张卷积来构建表征(hierarchical dilated convolutions)
- 匹配方面:提出细粒度的兴趣匹配机制(Fine-grained Interest Matching),在多层表征的基础上构建不同粒度的文本段(特征)相似度矩阵,得到多通道的匹配度矩阵,使用3D-conv来提取高阶重要特征来预测用户和新闻的匹配程度(点击概率)
模型
![](https://img.haomeiwen.com/i16043538/476cb9ded4b113ff.png)
整体模型架构如上所示
1. 新闻表征模块
![](https://img.haomeiwen.com/i16043538/bdb81e3b9a2d15d8.png)
![](https://img.haomeiwen.com/i16043538/9ac0326e54aea594.png)
![](https://img.haomeiwen.com/i16043538/41036a120252d7f0.png)
同时,计算路径大大缩短,没有使用池化等下采样方法,降低了信息丢失的负面影响。在并行能力在减少内存消耗方面优于RNN和基于注意力的方法。
2. 交叉交互模块 Cross Interation
![](https://img.haomeiwen.com/i16043538/5913ebe117b17637.png)
![](https://img.haomeiwen.com/i16043538/c19b5394ef7c486a.png)
最后将这些相似度矩阵组织成3D结构的图像Q,这个需要有点变换思想,相当于原来的矩阵合并到一起应该是n(L+1)N_dkN_c,文中按照图片的组织形式进行展示,一张图片为nN_dk*N_c的三维空间,同时图片有多个通道(L+1)个:
![](https://img.haomeiwen.com/i16043538/73c2f1a5f30a3d2d.png)
![](https://img.haomeiwen.com/i16043538/ef5ad4202e685a2d.png)
然后通过多层3D卷积网络来进行特征提取:
![](https://img.haomeiwen.com/i16043538/7862be485d4acf23.png)
![](https://img.haomeiwen.com/i16043538/616751d90de66747.png)
3. 点击预测
![](https://img.haomeiwen.com/i16043538/8685506333a133d5.png)
![](https://img.haomeiwen.com/i16043538/ef35a8abcf248b0c.png)
实验
数据集MSN, 羡慕啊,能多开源点么。。。
![](https://img.haomeiwen.com/i16043538/ac40f3ecb742b788.png)
![](https://img.haomeiwen.com/i16043538/4875189e1de60778.png)
![](https://img.haomeiwen.com/i16043538/3d54128f3e4da2f9.png)
总结
这篇文章利用HDC结构对用户建模做了改进,也使用简单粗暴的交互+3DCNN进行了兴趣匹配/特征提取,模型相较该团队以往模型还是更有特点的。
END
本人简书所有文章均为原创,欢迎转载,请注明文章出处 。百度和CSDN等站皆不可信,搜索请谨慎鉴别。技术类文章一般都有时效性,本人习惯不定期对自己的笔记/博文进行更新,因此请访问本人简书主页查看最新信息https://www.jianshu.com/u/40d14973d97c