大学,考研,学习大数据,机器学习,人工智能机器学习与数据挖掘

新闻推荐论文笔记(2):Neural News Recommen

2019-11-05  本文已影响0人  阿瑟_TJRS

摘要

个性化的新闻推荐对于在线新闻平台帮助用户找到感兴趣的新闻并改善用户体验非常重要。新闻和用户表示学习对于新闻推荐至关重要.

现有的新闻推荐方法通常基于单个新闻信息(例如标题)来学习这些表示,这可能是不够的。在本文中,我们提出了一种神经新闻推荐方法,该方法可以通过利用不同种类的新闻信息来学习用户和新闻的特征表示

我们方法的核心是新闻编码器和用户编码器。在新闻编码器中,我们提出了一种细心的多视图学习模型(Attentive Multi-view),通过将标题,正文和主题类别视为新闻的不同视图来学习统一的新闻表示形式

此外,我们将单词级别和视图级别的注意力机制(Word-level & View-level)应用于新闻编码器,以选择重要的单词和视图来学习信息性新闻表示。

在用户编码器中,我们基于用户浏览的新闻来学习用户的表示,并应用注意力机制来选择信息性新闻以进行用户表示学习。在真实数据集上进行的大量实验表明,我们的方法可以有效地提高新闻推荐的效果。

提出的方法

背景

工作受到以下观察的启发:

作者提出的推荐算法简称为NAML方法,下面介绍其组成部分,包括新闻编码器(News Encoder)和用户编码器(User Encoder)

新闻编码器(News Encoder)

新闻编码器模块用于从各种新闻信息(例如标题,正文和主题类别)中学习新闻的表示形式。 由于不同类型的新闻信息具有不同的特征,因此,我们提出了一种细心的多视图学习框架,以将每种新闻信息视为特定的新闻视图,从而学习统一的新闻表示形式,而不是简单地将它们合并成长文本来表示新闻。新闻编码器有四个主要组件。

用户编码User Encoder

对于一个用户,根据其近期浏览的历史新闻,对其进行特征表示:

同样采用注意力机制,利用News Encoder对历史新闻进行编码得到
最终用户的特征表示为:

最终描述用户对新闻的点击概率使用点积/内积inner product,点积几何意义上可以反映两个向量的夹角,是计算夹角余弦的重要部分

模型训练

利用负采样技术进行模型训练,用户浏览过的新闻作为正样本,并随机从未浏览过的新闻中抽取K个作为负样本,得到[\hat{y}^+,....,\hat{y}_i^-]每个用户有K+1个训练样本,得到损失函数如下:

该部分的损失函数设计主要受制于前面的预测函数设计,前后具有一致性。
部分实验结果如下:

总结

该文总体而言在算法设计上具有一定的创新性,从概念角度提出了attentive multi-view,在具体的框架选择和使用上有一定的创新,但不是特别明显。

上一篇下一篇

猜你喜欢

热点阅读