因果推断推荐系统工具箱 - DSC(一)

2021-12-16  本文已影响0人  processor4d

文章名称

【AAAI-2019】【Renmin University/Alibaba Group】Debiasing Career Recommendations with Neural Fair Collaborative Filtering

核心要点

文章旨在研究领域偏差是如何影响跨领域推荐的,并在此基础上提出了针对跨领域推荐的IPS模型以及3种学习propensity score的约束,形成基于因果嵌入向量的跨领域推荐框架,在进行跨领域推荐时,消除领域偏差对用户信息迁移到影响。

方法细节

问题引入

不同领域的用户往往有不同的行为模式[2]或不同的选择偏好[1],为跨领域迁移用户信息进行推荐带来困难。现有方法主要通过学习可以有效迁移跨域信息的embedding[3, 29, 40]来实现跨领域推荐,包括利用共享参数 [3, 40],特征映射[2],语义空间对齐等。尽管这些方法在跨域推荐上效果很好,但它们并没有显示建模用户偏好存在跨域差异的原因。

作者在分析实际业务数据中发现,存在领域相关的混淆变量,影响了用户在特定场景的偏好,进而影响了用户在该场景下的选择,造成选择性偏差。例如,一个用户美妆兴趣的用户,在快销场景(快销APP)中,倾向于选择便宜,优惠力度大,物美价廉的品牌,而在好物推荐(兴趣探索APP)中倾向于关注品质好,吸引人,且相对昂贵的奢侈品牌。

具体做法

作者提出的debiase cross-domain推荐框架主要是利用扩展的IPS模型消除domain-specific confounders(DSC),一言以蔽之,

  • 构建因果图,将影响推荐结果的混淆变量分为2类,domain-specific confounders (DSC) 以及 general confounders (GC),主要消除DSC对跨领域推荐带来的影响。
  • 扩展IPS模型,并利用3种约束(estimator level, domain level以及individual level)解决跨领域propensity score数据稀疏造成的估计困难的问题。

作者将跨领域推荐问题定义如下,

  • \mathcal{D},\mathcal{U},\mathcal{I}分别表示领域、用户、物品的集合。
  • \mathcal{J}不同领域共享的物品特征的集合,每一个物品的特征包含的特征集合为\mathcal{J}_i = \{ j_1,\ldots,j_m \} \subset \mathcal{J}(因为不同的物品在不同的领域只包含一部分特征,同样的物品可能只出现在一个领域。不过有点奇怪的是,共享的特征不应该是个自己子集么?)。
  • v_u, v_u^d分别表示用户u的全局偏好(比如,喜欢美妆)以及领域偏好(例如,在快销APP喜欢打折力度大的物品)。
  • 跨领域推荐的目标是,对给定的用户、物品以及物品特征u, i,\mathcal{J}_i,学习通用的用户偏好v_u消除v_u^d的影响,更好的预测用户的反馈y_{ui},并可以迁移到其他领域。

值得注意的是,作者强调用户是多领域有重合的,而不强制要求物品有较大重合。

因果图

作者定义的因果图,如下图所示,其中v_j^d是物品在特定领域的特征表示。可以看出整体的confounder影响了用户在各个领域对物品的评分,而领域特有的confounder只影响某个领域的用户对物品的评分。

Causal Graph

值得注意的是,除了领域特有的confounder以外,作者并没有假设整体confounder会影响用户的偏好,而是假设领域偏好是受整体偏好和领域confounder共同影响。

本节介绍了作者要解决的跨领域推荐的背景,解决的思路以及因果图的结构,下一节继续讲解作者提出的IPS模型,以及优化估计的方法。

心得体会

因果图

个人感觉,作者的因果图里还可以再多两个因果关系,即通用的confounder也会影响作者的领域偏好,只不过这个影响可能比较弱,在领域间是可以消除的,或者说抵消的。这样也可以总结成一条因果关系,即GC \rightarrow v_u。不过似乎作者认为,这两种都可以省略。

文章引用

[1] Ning Zhou and Jun-Yuan Xie. 2011. Select web services based on qualitative multi-users preferences. Dianzi Xuebao(Acta Electronica Sinica) 39, 4 (2011).

[2] Ali Mamdouh Elkahky, Yang Song, and Xiaodong He. 2015. A multi-view deep learning approach for cross domain user modeling in recommendation systems. In WWW. 278–288.

上一篇下一篇

猜你喜欢

热点阅读