迁移学习中的条件概率分布与边缘概率分布

2019-11-09 本文已影响0人 duadua223

在迁移学习中，一个热门的研究方向是领域自适应（Domain Adaptation）。在领域自适应的定义中，涉及到条件概率分布与边缘概率分布，先就其定义解释如下。

首先定义联合概率。假设有随机变量 $X$ 与 $Y$ ，此时 $P(X=a, Y=b)$ 用于表示 $X=a$ 且 $Y=b$ 的概率。这类包含多个条件且所有条件同时成立的概率称为联合概率。联合概率一览表被称为联合概率分布。

接下来定义边缘概率。边缘概率与联合概率相对应，当 $P(X=a)$ 或 $P(Y=b)$ ，这类仅与单个随机变量有关的概率称为边缘概率。边缘概率一览表被称为边缘概率分布。

条件概率表示在条件 $Y=b$ 成立的情况下， $X=a$ 的概率，记作 $P(X=a|Y=b)$ 或 $P(a|b)$ 。它具有如下性质：在条件 $Y=b$ 下，穷举 $X$ 的可取值之后，所有这些值对应的概率之和为1，即： $∑aP(X=a|Y=b)=1$

联合概率、边缘概率、条件概率的关系如下： $P(X=a, Y=b) = P(X=a | Y=b) * P(Y=b)$ ，以离散型概率分布为例，我们举出如图1所示的概率分布表来说明联合分布与边缘分布。

图1 离散型概率分布表

在迁移学习中，不同的学习方法可以通过特征空间的异同、类别空间的异同、条件概率分布的异同以及边缘概率分布的异同来区分（如图二所示）。根据《迁移学习简明手册》给出的领域自适应定义，假定源域和目标域的特征空间、类别空间以及条件概率分布均相同，但是这两个域的边缘分布不同，我们的目标是利用有标记的数据去学习分类器来预测目标域的标签。为了完成迁移学习，我们需要以度量为准则，通过我们所要采用的学习手段，来增大两个领域之间的相似性。因此我们需要定量度量两个领域的相似性，下文中将对度量领域相似性的经典方法（MMD）与其他在具体问题上的相似性度量方法进行介绍。

图2. 迁移学习的一种区分方式

参考文献

1.https://en.wikipedia.org/wiki/Marginal_distribution

2.https://github.com/jindongwang/transferlearning-tutorial

3.https://blog.csdn.net/dakenz/article/details/85954548

迁移学习中的条件概率分布与边缘概率分布

猜你喜欢

热点阅读