论文阅读"Discovering New Intents wit

2021-08-29  本文已影响0人  掉了西红柿皮_Kee

@article{Zhang_Xu_Lin_Lyu_2021,
title={Discovering New Intents with Deep Aligned Clustering},
volume={35},
number={16},
journal={Proceedings of the AAAI Conference on Artificial Intelligence},
author={Zhang, Hanlei and Xu, Hua and Lin, Ting-En and Lyu, Rui},
year={2021},
month={May},
pages={14365-14373}
}

摘要阅读

发现新的意图是对话系统中的一项关键任务。大多数现有的方法在将先验知识从已知意图转移到新意图方面受到限制。他们还难以提供高质量的监督信号,因而无法学习聚类友好的特征来分组未标记的意图。本项提出了一种有效的方法,Deep Aligned Clustering---深度对齐聚类,在有限的已知意图数据的帮助下发现新的意图。首先,利用一些标记的已知意图样本作为先验知识,对模型进行预先训练。然后,执行k-means来生成作为伪标签的集群分配。此外,论文还提出了一种对齐策略来解决聚类分配过程中的标签不一致性问题。最后,在对齐的伪标签的监督下学习意图表示。对于未知数量的新意图,通过消除低置信度的意图集群来预测意图类别的数量。

任务引入
Task info
模型简述
Model

模型首先用BERT提取意图表示。然后,用有限的标记数据从已知的意图中转移知识。最后,提出了一种对齐策略来提供学习聚类友好表示的自监督信号。

我们使用聚类效度指数(CVI)来评估聚类后在每个训练阶段获得的聚类的质量。具体来说,我们采用无监督度量剪影系数进行评估:

盲猜这里应该用于判断当前的自监督训练停止的指标。


第一次分割线 --
以我不成熟的认识,我觉得模型的组成和运行分成了三个组成:
(1)

首先是紫色图的学习,这一部分和我在“Transferring Knowledge from Known Intents”下"step-1. Pre-training"给出的图一致。 主要是用labeled data对模型进行一个预训练,训练完成后移除分类层待用。
(2) 使用框标记的部分对数据的K值进行预测。
(3) 第三个组成包含几个模块:首先是左侧红框中,使用伪分类器得到分类标签;然后是水蓝色框中,使用固定的K对数据进行聚类,得到聚类分配的标签;对于分配的结果有两个分支选择,其一:得出伪标签计算聚类指标,查看是否停止自监督训练,其二:使用蓝圈内进行对齐得到对齐后的标签,与BERT输出的标签形成loss函数进行训练。
具体做法还需要查看源码。。
上一篇 下一篇

猜你喜欢

热点阅读