联邦学习的三种场景

2019-07-23 本文已影响0人飞驰2019

在前面的文章中提到，联邦学习是一套将多方数据安全地联合起来进行建模的技术体系。显而易见的是，各参与方的数据覆盖程度对联邦学习的应用方式至关重要。根据具体情况的不同，大体可以分为一下3种场景：

1. 用户覆盖小，特征覆盖大：

图 1

典型例子就是联邦学习的参与企业均属同一行业的情况（如地方性银行）。由于各参与企业业务相似度较大，因而从业务数据中提取出的特征也极为相似。在这种情况下，可以采用的建模方法是利用多方特征的交集作为特征，多方用户的并集作为样本。从结果上来看，通过联邦学习的应用，实现了样本规模的扩充。

2. 用户覆盖大，特征覆盖小：

图 2

典型例子就是联邦学习的参与企业位同一地区，但分属不同行业的情况。由于参与企业的所在区域重叠，因而服务的用户重叠度通常也较高。在这种情况下，可以采用的建模方法是利用多方特征的并集作为特征，多方用户的交集作为样本。从结果上来看，通过联邦学习的应用，实现了特征规模的扩充。

3. 用户覆盖小，且特征覆盖小：

图 3

如果参与企业即非来自同一行业，又不位于同一地区，则属于此类场景。在该场景下，简单的联合方法显然无法奏效。然而在联邦学习中，对于此类场景有其独特的解决方法，即迁移学习。不难看出，此场景下的方案可以同样应用于前两种场景，具备极大的适用性，因而迁移学习是联邦学习的核心内容。关于迁移学习在联邦学习的应用，仍然在后续结合FATE项目进行探讨。

联邦学习的三种场景

猜你喜欢

热点阅读