隐式反馈(2)- 论文速读 Unbiased Pairwise
前言
-
发表在期刊ICTIR 2020(ACM SIGIR International Conference on the Theory of Information
Retrieval ()上的一篇关于Top-N推荐的论文
- 本篇笔记为本人原创,如需转载引用,请务必在文中附上原链接及相应说明,包括作者信息(阿瑟)
- 码字不易,好心人随手点个赞
- 本篇笔记为速读笔记,非标准译文,其中包含了笔者自己对问题的部分理解,仅供参考,欢迎学习交流
- 这篇论文的理论性比较强,比较难懂......
摘要
隐式反馈数据的应用比显式反馈数据复杂得多,因为隐式反馈只提供正反馈,我们无法知道未交互的反馈是正反馈还是负反馈。
此外,对冷门物品的交互数量远少于流行物品,这些冷门物品的相关性常常被低估(数据有偏)。针对这些挑战的现有解决方案可能偏向于理想的兴趣损失函数,或者使用一种简单的Point-wise方法,这种方法不适用于排名任务。
文章首先定义了一个理想的Pair-wise损失函数定义,使用真实值相关参数来优化排序指标。
随后,我们针对Pair-wise损失提出提出了一个理论上的无偏估计器和相应的算法,无偏贝叶斯个性化排序(Unbiased Bayesian Personalized Ranking)。针对使用隐式反馈的两个主要挑战的Pairwise算法还有待研究,而本文算法是第一个从理论上主要解决这些挑战的Pair-wise方法。通过理论分析,我们给出了所提出的无偏估计量的临界统计性质和一种实用的方差减少技术。
引言
使用隐式反馈提出建议面临两大挑战。
- 首先,隐式反馈只包含正反馈,而负反馈不被观察到。(Positive-unlabeled)换句话说,我们无法知道用户历史记录中的未交互项是否与用户无关,或者仅仅是尚未公开。解决隐式反馈的这种正向无标签的本质对于推荐与物品高度相关的项目是必不可少的。
第二个挑战是缺失的反馈机制是缺失的——(Missing-not-at-random,MNAR)。例如,用户更有可能与受欢迎的项目互动,推荐系统也更有可能推荐受欢迎的项目而不是尾部项目[23]。众所周知,这种有偏见的反馈数据导致次优的建议。(长尾效应)
基本知识/前提
1. 隐式反馈问题的抽象定义
Y:交互信息;O表示用户跟物品的曝光变量;R表示用户和物品的相关性。 涉及的参数为相比之下,上式假定交互概率(需要预测的概率)可以表示为曝光量与相关性参数的乘积。在这种假设下,MVAR 问题被解释为由于曝光概率不均匀而导致交互概率和相关性水平不成比例的情形。 虽然用户和物品很相关,但由于物品曝光率的差异导致推荐差异
2. 评估指标
我们不应该从用户体验的角度来衡量推荐系统的质量,因为点击并不总是意味着与我们的模型的相关性。这促使我们考虑使用相关级别作为性能指标,定义的以下评价指标:
即考虑每个交互的相关性。
3. 理想化的损失函数
相关性预测器或评分函数,需要最小化使用相关水平定义的理想损失,以期得到更好的性能表现。因此,我们把隐式反馈问题看作是一个统计估计问题,目的是仅使用有偏的交互反馈来估计理想损失函数。
算法介绍
该部分自己还没看明白,先贴上相关公式,后续再更新....
首先正式定义了一个参数,叫做倾向评分,它在因果推断中起着关键作用
即给定用户-物品相关下,用户跟物品交互的概率。 也可以拆份成下面的形式实验
数据集使用的是有评分的显式评分
没看明白其操作,等待后续更新
总结
等待后续更新
END
本人简书所有文章均为原创,转载请提前联系 。百度和CSDN等站皆不可信,搜索请谨慎鉴别。本人习惯不定期对自己的博文进行修正和更新,因此请访问本人简书主页查看最新文章https://www.jianshu.com/u/40d14973d97c