【论文学习】《A Unified MRC Framwork fo

2021-04-19  本文已影响0人  三方斜阳

论文:https://arxiv.org/abs/1910.11476
源码:https://github.com/ShannonAI/mrc-for-flat-nested-ner
使用机器阅读理解的方式去解决 命名实体(NER) 任务,主要在数据的构建上面,对于每一个实例句子作为 context,前面拼接一个 query 块,这个 query 是对实体的描述,比如:

  • which person is mentioned in the text
  • find an organization such as company, agency and institution in the context

MRC抽取答案的方法是预测答案的开始位置和结束位置,有两种方案:

  1. 设计2个n-classes分类器(n为句子长度),分别预测答案的开始位置和结束位置。这种方案在给定一个context和一个question时只能得到一个答案,无法处理句子中存有多个实体的问题,更不能解决实体嵌套的问题;
  2. 设计2个2分类器,其中一个分类器负责预测每个字符是否是实体开始位置,另一个分类器负责预测每个字符是否是实体的结束位置。这种方案在给定一个context和一个question时支持多个实体开始位置和多个实体结束位置

Loss:

tips:

模型结构不复杂,主要在于数据集的构建,论文结果是比一般的 NER 方法好,论文中说到时 借鉴19年另一篇 转换为 阅读理解任务做关系抽取 的工作

参考:
https://zhuanlan.zhihu.com/p/103779616?utm_source=qq
基于MRC框架的命名实体识别方法

上一篇下一篇

猜你喜欢

热点阅读