迁移学习中的条件概率分布与边缘概率分布

2019-11-09  本文已影响0人  duadua223

在迁移学习中,一个热门的研究方向是领域自适应(Domain Adaptation)。在领域自适应的定义中,涉及到条件概率分布与边缘概率分布,先就其定义解释如下。

首先定义联合概率。假设有随机变量XY,此时P(X=a, Y=b)用于表示X=aY=b的概率。这类包含多个条件且所有条件同时成立的概率称为联合概率。联合概率一览表被称为联合概率分布。

接下来定义边缘概率。边缘概率与联合概率相对应,当P(X=a)P(Y=b),这类仅与单个随机变量有关的概率称为边缘概率。边缘概率一览表被称为边缘概率分布。

条件概率表示在条件Y=b成立的情况下,X=a的概率,记作P(X=a|Y=b)P(a|b)。它具有如下性质:在条件Y=b下,穷举X的可取值之后,所有这些值对应的概率之和为1,即:∑aP(X=a|Y=b)=1

联合概率、边缘概率、条件概率的关系如下:P(X=a, Y=b) = P(X=a | Y=b) * P(Y=b),以离散型概率分布为例,我们举出如图1所示的概率分布表来说明联合分布与边缘分布。

图1 离散型概率分布表

在迁移学习中,不同的学习方法可以通过特征空间的异同、类别空间的异同、条件概率分布的异同以及边缘概率分布的异同来区分(如图二所示)。根据《迁移学习简明手册》给出的领域自适应定义,假定源域和目标域的特征空间、类别空间以及条件概率分布均相同,但是这两个域的边缘分布不同,我们的目标是利用有标记的数据去学习分类器来预测目标域的标签。为了完成迁移学习,我们需要以度量为准则,通过我们所要采用的学习手段,来增大两个领域之间的相似性。因此我们需要定量度量两个领域的相似性,下文中将对度量领域相似性的经典方法(MMD)与其他在具体问题上的相似性度量方法进行介绍。

图2. 迁移学习的一种区分方式

参考文献

1.https://en.wikipedia.org/wiki/Marginal_distribution

2.https://github.com/jindongwang/transferlearning-tutorial

3.https://blog.csdn.net/dakenz/article/details/85954548

上一篇下一篇

猜你喜欢

热点阅读