[PML 4] C1S3 个性化技术
正如前文所说, 本书的一个目标是建立起一套叙述个性化算法的通用表述。 虽然我们介绍了很多种个性化的应用, 但是我们发现这些模型背后都follow 一些类似的范式。
User Representations as Manifolds
我们将在本书中重新讨论的主要思想之一——它允许我们将推荐系统的思想应用于其他类型的机器学习——用户流形 (不知道怎么翻译 User Manifolds, 先用 “用户流形” 吧)。也就是说,我们将探索的大多数个性化方法都将涉及的, 描述用户活动和交互中常见变化模式的用户表示。
在推荐系统中, 用户流形可能是描述用户喜好的主要维度。 比如, 对于电影推荐系统,主要feature 就围绕着 电影类型,演员或者特效。 在本书中, 我们都会使用用户流形这个概念, 我们又用它来描述随着用户不同而变化的数据中, 不变模式的部分 (Throughout the book, we’ll revisit the idea of user manifolds, as a general-purpose means of capturing common patterns of variation among users.) 。
推荐系统和各种其他类型的个性化机器学习背后的基本思想是通过描述用户交互之间差异模式的低维流形来表示用户。推荐系统使用低维向量来描述用户和物品,相符的用户和物品的方向会比较接近。(第 5 章)。-
第五章, 我们用低维用户表示(user representations), 来描述用户的喜好和行为,这种方法可以根据用户的喜好和行为, 进行推荐。
-
第八章, 会用user representations来描述用户经常讨论的内容(评论), 或者他们的写作特点。
-
第九章, user representations 用来描述视觉维度, 这样我们可以对图片进行排序, 推荐或者生成个性化图片。
-
在各种例子中,用户表示会被用来捕捉各种特征,从饮食习惯(8.4.2),健身习惯(7.8),社会信任(social trust 6.4.1)或者时尚选择(9.3)。
基于上下文的个性化 与 基于模型的个性化 (Contextual Personalization and Model-Based Personalization)
尽管本书将主要涵盖显式建模用户术语的方法,但还将涵盖一些故意避免这样做的模型。
从简单的方法开始,例如“买了 X 的人也买了 Y”,许多经典的推荐方法(例如)利用用户数据,但不包括与用户关联的显式参数。然而,这些模型仍然是个性化的,因为它们将根据每个人与系统的交互方式为每个人做出不同的预测。简单的机器学习技术,例如我们在第 2 章和第 3 章中开发的那些,其中用户由一些精心设计的特征代表,也遵循这种范式。
基于模型和上下文个性化来区分这两类方法:基于模型的方法学习与每个用户相关的一组显式参数,例如上面描述的“用户流形”;这些模型通常旨在捕捉系统中用户之间的主要变化模式,通常是在低维向量方面。相比之下,上下文(有时也称为“基于记忆的”,如第 5 章所述)方法从用户最近交互的历史中提取特征。
在几种场景下,上下文个性化可能比显式建模用户更可取。在第 4 章中开发简单的推荐系统,在第 2 章和第 3 章中开发更简单的个性化模型时,我们看到个性化通常可以通过简单的启发式、手工制作的特征或相似性度量来实现。出于多种原因,此类方法有时候可能更好,比如:简单的模型可能更易于解释(因此与“黑盒”预测相比,更适合向用户展示);或者,一开始可能缺乏足够的训练数据来从头开始学习复杂的表示。