论文阅读-Learning Span-Level Interac

2021-08-05  本文已影响0人  WritingHere

Learning Span-Level Interactions for Aspect Sentiment Triplet Extraction

作者 & 机构:
Lu Xu^{1,2}, Yew Ken Chi^{1,2}, Lidong Bin^2
^1Singapore University of Technology and Design2DAMO Academy, ^2Alibaba Group

链接 : [https://aclanthology.org/2021.acl-long.367.pdf]

研究主题

文章总结(What)

本文使用基于span的方法来进行ASTE(Aspect Sentiment Triplet Extraction,方面情感三元组抽取),使用span的好处是可以实现观点词和目标词的整体的交互,从而更好地识别情感。

解决的主要问题(Why)

以往的模型使用的是word-word级别的交互,这可能对关系判断造成误导,作者使用span级别的交互,从整体考虑,从而避免了这一问题。

详细信息(How)

方法论

20210805_1.png

模型总体流程如上图所示,先枚举span,然后对span进行判断是否有效,做一个剪枝,然后两两组合,得到span的表示,最后判断正负极性。
可以学习的点有:

  1. 强调剪枝操作
    先判断一个span是否是target 或者 opinion,
    P(m|s_{i,j}) = softmax(FFNNm(s_{i,j}))
    然后选择target和opinion中得分靠前的若干个span作为候选,
    \Phi(target(s_{i,j})) = P(m=target|s_{i,j})
    \Phi(opinion(s_{i,j})) = P(m=opinion|s_{i,j})
    作者把这个叫做dual channel span purning

  2. pair的表示
    g_{s^t_{a,b},s^o_{c,d}}= [s^t_{a,b};s^o_{c,d};f_{distance}(a, b, c, d)]
    pair的表示中,加上了两个span的disance,其中distance=min(|b - c|, |a - d|)

实验与分析

实验结果
  1. 首先肯定是主实验达到了SOTA的
  2. 单独比较ATE和OTE的抽取效果,分别在两个子任务上达到了SOTA
  3. 然后,为了呼应开头,作者说使用span的方法可以弥补word-word的一些缺陷,例如"not good", "food", 结果应该是(food, not good, negative),然后使用word-word级别的图的话,food和good以及not分别交互,从而可能将三元组判断为postitive。因此,作者说span级别可以整体交互,从而效果更好。因此,作者着重开展了相关实验,分别统计了single-word和multi-word的效果,可以发现multi-word的效果提升更为明显。除此之外,作者还开展了更为详细的实验,分别计算opinion和target中multi-word的得分,作者发现当opinion中含有multi-word的时候,效果更差,可能是数据不均衡的原因。
  4. 剪枝效果,作者又比较了剪枝的效果,即不同的剪枝策略的影响。关于双通道,单通道这里还没看明白,还需要研究。
  5. 定性分析,也就是case study了,作者举了一个例子,说明了span based方法的效果,尤其是针对multi-word方面。
  6. 消融实验,作者分析了在span表示和关系表示中是否考虑pooling信息,distance等的影响。

未来展望

暂无

其他

上一篇下一篇

猜你喜欢

热点阅读