论文阅读“Deep Incomplete Multi-view

2022-06-01  本文已影响0人  掉了西红柿皮_Kee

Xu J, Li C, Ren Y, et al. Deep Incomplete Multi-view Clustering via Mining Cluster Complementarity[C]. AAAI2022.

摘要导读

现有不完整多视图聚类存在两点限制:
(1)对缺失数据进行不正确的推断或者填充可能会对聚类产生负面的影响;
(2)融合后特征的质量可能会受到低质量视图的影响。
针对以上问题,本文提出了一种imputation-free 和 fusion-free的IMVC框架。主要贡献包含以下:

模型浅析

数据定义:
给定包含N个样本的数据集\{X^v \in R^{N_v \times D_v}\}_{v=1}^V,其中N_v代表样本的数目,因为包含缺失数据,因此N_v \leq N。本文中把数据集中包含的完整数据作为一个集合\mathcal X

根据给出的定义,笔者认为文章中所涉及到的数据集应该仅包含缺失视图的情况。即对于两视图数据而言,

视图1和视图2中最下的蓝色部分是完整数据,这部分的数据包含给定的全部视图表示。而视图1最上的样本集合仅包含视图1的表示,同理视图2中间的样本也仅包含当前视图表示。也就是说,在数据表示中完整样本是视图对齐的。(这里的解释和论文intro中的关于数据的定义完全不对应。。所以后续的样本对应和拼接的解释很牵强。。。。)

但是论文中的解释,对于每个视图的数据而言,这里给出了一个示意图:

其中,2代表的是该视图中缺失的样本,3代表的是该视图中完整的样本,1是指样本的样本表示中存在某些维度的缺失。(笔者认为这种解释没办法和intro中关于数据的定义对应,所以一顿迷茫)所以我觉得关于完整视图的对应(模型图中的红框),maybe是错误的,至少完整视图的数据应该是在同样的位置,这样才可以在后续的操作中进行拼接H=[\cdot, \cdot]
怎么说,因为自己太菜了,所以看的云里雾里的。在模型训练的始末都没有涉及到关于missing data的处理,其实我挺懵的,还有对样本的对应关系也没厘清。。。之后再进行修正吧。。
上一篇下一篇

猜你喜欢

热点阅读