论文阅读-Learning Span-Level Interac
2021-08-05 本文已影响0人
WritingHere
Learning Span-Level Interactions for Aspect Sentiment Triplet Extraction
作者 & 机构:
Lu Xu, Yew Ken Chi, Lidong Bin
Singapore University of Technology and Design2DAMO Academy, Alibaba Group
链接 : [https://aclanthology.org/2021.acl-long.367.pdf]
研究主题
- Category (General) : 信息抽取
- Category (Specific) : 观点情绪挖掘
文章总结(What)
本文使用基于span的方法来进行ASTE(Aspect Sentiment Triplet Extraction,方面情感三元组抽取),使用span的好处是可以实现观点词和目标词的整体的交互,从而更好地识别情感。
解决的主要问题(Why)
以往的模型使用的是word-word级别的交互,这可能对关系判断造成误导,作者使用span级别的交互,从整体考虑,从而避免了这一问题。
详细信息(How)
方法论
20210805_1.png模型总体流程如上图所示,先枚举span,然后对span进行判断是否有效,做一个剪枝,然后两两组合,得到span的表示,最后判断正负极性。
可以学习的点有:
-
强调剪枝操作
先判断一个span是否是target 或者 opinion,
然后选择target和opinion中得分靠前的若干个span作为候选,
作者把这个叫做dual channel span purning -
pair的表示
pair的表示中,加上了两个span的disance,其中
实验与分析
实验结果- 首先肯定是主实验达到了SOTA的
- 单独比较ATE和OTE的抽取效果,分别在两个子任务上达到了SOTA
- 然后,为了呼应开头,作者说使用span的方法可以弥补word-word的一些缺陷,例如"not good", "food", 结果应该是(food, not good, negative),然后使用word-word级别的图的话,food和good以及not分别交互,从而可能将三元组判断为postitive。因此,作者说span级别可以整体交互,从而效果更好。因此,作者着重开展了相关实验,分别统计了single-word和multi-word的效果,可以发现multi-word的效果提升更为明显。除此之外,作者还开展了更为详细的实验,分别计算opinion和target中multi-word的得分,作者发现当opinion中含有multi-word的时候,效果更差,可能是数据不均衡的原因。
- 剪枝效果,作者又比较了剪枝的效果,即不同的剪枝策略的影响。关于双通道,单通道这里还没看明白,还需要研究。
- 定性分析,也就是case study了,作者举了一个例子,说明了span based方法的效果,尤其是针对multi-word方面。
- 消融实验,作者分析了在span表示和关系表示中是否考虑pooling信息,distance等的影响。
未来展望
暂无