News推荐研究专区

新闻推荐(10):News Graph: An Enhanced

2020-10-12  本文已影响0人  阿瑟_TJRS

前言

  1. 构建协同关联边,定义三种协同关系(新闻共现,同一用户共现等)
  2. 利用新闻类别和LDA主题分布作为主题实体,加入图谱
  3. 提出一个搜索算法,剔除无关的实体。

模型方法

NG的简单示例如下:注意图中不同颜色的边,代表着不同关系

1. 剔除无关实体

算法如下:核心思想即对新闻内出现的每个实体进行关联搜索,在2跳的步数内计算相关边的权重(关系的重要程度),主要是找到新闻实体之间的可达路径,选取重要度TopN的关系,然后选取这些关系相关的三元组构成新的图谱

2. 利用协同关系

  1. 同一新闻中的实体存在关联
  2. 被同一用户点击过的实体存在关联; 文中举了一个例子:很多用户是五月天和周杰伦的双粉,然而通用KG中二者并非直接关联,通过这种协同关系NG可以充分利用这种潜在的关联。
  3. 出现在同一session的实体存在关联

3. 利用主题信息

新闻主题是吸引用户关注的重要因素。并非每篇新闻文章都包含知识实体。有时候用户点击文章仅仅是因为他们喜欢这些主题。为了填补文章中不包含知识实体或包含非信息实体的空白,文章利用新闻主题补充实体的信息。

考虑新闻文章的两种主题信息,即文章的显性主题和隐性主题。

作为编辑分类的文章类别标签是文章最好的明确的主题信息。然而,有时简单的分类信息可能不够全面,不足以代表文章的主题,特别是当文章没有分类标签的时候,所以还利用LDA主题模型来得到文章的隐含主题。

实验

MSN数据构建知识图谱,利用TransE对NG进行预训练得到节点和关系嵌入。
对于文章本身的内容信息,使用BERT等模型获取,最后文章的表示为实体信息和内容信息的融合:


Attentive Pooling 计算过程如下所示: 对比实验结果如下:

总结

本文针对新闻推荐这一特定领域,提出了一种构建知识图谱的方法,整合协同关系和主题信息,对提升推荐效果有重要帮助。

END

本人简书所有文章均为原创,欢迎转载,请注明文章出处 。百度和CSDN等站皆不可信,搜索请谨慎鉴别。技术类文章一般都有时效性,本人习惯不定期对自己的笔记/博文进行更新,因此请访问本人简书主页查看最新信息https://www.jianshu.com/u/40d14973d97c

上一篇下一篇

猜你喜欢

热点阅读