论文阅读“Adversarial Incomplete Mult
2022-08-06 本文已影响0人
掉了西红柿皮_Kee
Xu C, Guan Z, Zhao W, et al. Adversarial Incomplete Multi-view Clustering[C] //IJCAI. 2019: 3933-3939.
摘要导读
多视图聚类的目的是利用来自多个视图的信息来提升聚类效果。以前的大多数研究都假设每个视图都有完整的数据。然而,在真实数据集中,视图可能包含一些缺失的数据,导致不完整的多视图聚类问题。以往解决这一问题的方法至少有以下缺点之一:(1)采用浅层模型,不能很好地处理不同视图之间的依赖性和差异;(2)忽略了缺失数据所包含的隐藏信息;(3)专门用于双视图的情况。为了消除所有这些缺点,本文提出了一种对抗的不完全多视图聚类(AIMC)方法。与大多数现有的方法只使用现有的视图学习新的表示方式不同,AIMC寻求多视图数据的公共潜在空间,并同时执行缺失的数据推断。具体来说,提出的模型集成了元素重构和生成对抗网络(GAN)来推断缺失的数据。它们的目标是分别捕获数据的整体结构和获得更深层次的语义理解。此外,还设计了一个对齐的聚类损失,以获得更好的聚类结构。
符号和问题描述
在不完整的多视图聚类的设置中,样本具有多个视图,这些视图可能是完整的也可能是部分完整的。给定一个具有个视图、
个完整样本和
个不完整样本的数据集,如下图展示:

使用来分别表示视图
的第
/
个完整或不完整样本,其中
是第
个视图的数据维度。构建指示矩阵
来记录视图的不完整性,该矩阵只针对视图表示不完整的样本。每个元素值由如下确定:


模型浅析

由模型图可以看出,整个架构是一个编码器-解码器流水线,分别包括了
- Encoder
第个编码器
专门用于学习第
个视图输入到对齐子空间
的映射。在每个视图中
是相等的。这里使用 average pooling来得到每个样本的公共表示
。为了实现更好的子空间对齐和对缺失数据的推断,这里将每个
和
放在相同的角色中(即输入到解码器)来重建相应的
。这部分与大多视图的多视图自编码器是一致的。
- Decoder
解码器用于重建原始数据
,并使用公共潜在表示
生成不完整实例的缺失视图。其输出
即是对原始输入
的重构,也是对缺失数据的推断。然而,重构损失并不能明确地捕获数据维度之间的相关性,而这种相关性对于描述一个视图的潜在分布来说很重要。继而引入判别器
来学习数据维度之间的相关性。对于每个视图,使用原始数据
和重构数据
及其标签(分别为True和False)来训练鉴别器
。每一对
形成一种对抗关系,可以对数据有更深的语义理解,从而更好地生成缺失数据。
- Loss Function
本模型通过原始的完整实例和不完整的实例
来进行训练。其目标是学习多视图数据的通用表示,并同时精确地重建原始数据。
(1)Reconstruction Loss
第一部分为在完整样本中,分别使用公共表示
和各视图表示
的重构损失,第二部分为在不完整样本中,使用公共表示
和各视图表示
的重构损失。其对应的计算如下:
(2)Adversarial Loss
传统的GAN框架应用于多视图重构,将解码器作为生成器,即在提出的模型中,多视图重建的问题是在对抗性的设置中建模的,以学习条件分布的
,
,其中
为公共潜在表示
、
,或视图特定的潜在表示
、
。因此,这里的对抗损失可以分为4个部分,以
为例的对抗损失表示为:
其中红框内的条件可以进行置换。
(3)KL Aligned Clustering Loss
这部分主要是基于完整数据做一个聚类模块的对齐,其思路来自于DEC2016。这里充分利用了和
的特征,首先为每个视图都构造了一个特有的
分布:
同时也使用公共潜在表示
构造了
,并构造了所有视图的目标分布
:
并强制拉近每个视图分布和目标分布之间的KL散度:
通过优化
,可以逐渐缩小不同视图的分布差距,从而增强不同视图之间的公共潜在表示。
(4)Joint Loss
该论文思路非常清晰,充分应用了AE框架的优势结合GAN达到了对缺失视图数据的推断。其实验在三个多视图数据上都取得了很好的效果,

对于Youtube数据集数据量较大,并且模型涉及到了数据的推断生成,这里将基础框架换成VAE模型是不是可以兼顾数据推断和大数据集两个点?
作者的写作风格非常值的借鉴!!