CAIL 2020-司法人工智能挑战赛(阅读理解)

2020-05-16  本文已影响0人  魏鹏飞

任务一:阅读理解

1. 任务介绍

CAIL2019上我们提出了中文司法阅读理解任务,今年我们将提出升级版,不仅文书种类由民事、刑事扩展为民事、刑事、行政,问题类型也由单步预测扩展为多步推理,难度有所升级。

具体而言,对于给定问题,只通过单句文本很难得出正确回答,选手需要结合多句话通过推理得出答案。

我们允许选手使用去年的阅读理解数据集(CJRC)作为辅助数据集,同时允许选手使用任何外部资料作为知识来帮助模型,但是我们要求选手在预测过程中不能够进行联网的操作。

更多的详细信息以及下文提到的资源都可以参考https://github.com/china-ai-law-challenge/CAIL2020/tree/master/ydlj

2. 数据介绍

本任务技术评测训练集包括两部分,一部分为去年的CJRC训练集,一部分为重新标注的约3000个问答对,其中民事、刑事、行政各1000个问答对,均为需要多步推理的问题类型。验证集和测试集各约3000个问答对,同样均为需要多步推理的问题类型。

3. 评价方式

本任务采用F1进行评估。

对于每个问题,需要结合案情描述内容,给出回答,回答为Span(内容的一个片段)、YES/NO、Unknown中的一种,并且给出答案依据,即所有参与推理的句子编号。评价包括两部分:1)Answer-F1,即预测答案会与标准答案作比较,计算F1;2)SupFact-F1,即预测句子编号序列会与标准句子编号序列作比较,计算F1。最终为这两部分F1的联合F1宏平均

4. 基线系统

我们将提供一组基线模型,即BERT的阅读理解模型。

5. 参赛方式

6. 赛程安排

7. 奖项设置

挑战赛将对阅读理解任务评出一等奖1名,二等奖2名,三等奖4名。由主办方中国中文信息学会(CIPS)为获奖者提供荣誉证书认证;由科大讯飞股份有限公司和中国司法大数据研究院为获奖者提供奖励和参会交流赞助。

参考链接:
http://cail.cipsc.org.cn/instruction.html

上一篇 下一篇

猜你喜欢

热点阅读