基于区别性的法律属性来预测少样本的法律案件

2020-07-07  本文已影响0人  烛之文

1 前言

这次分享一篇关于法律案件预测的paper,发表在2018年COLING会议上。论文标题为:Few-Shot Charge Prediction with Discriminative Legal Attributes,论文下载链接。因为关于法律案件的预测问题已有很多相关的paper, 为此,作者基于该任务提出了两点创新:一是增加Discriminative Legal Attributes识别任务,来辅助提高Charge Prediction任务;二是解决一些标签少样本(Few-Shot)的问题。

2 任务背景

3 Model

作者提出的十类属性

作者提出10个属性特征,在标注的时候,采用(YES,NO)的二分类;同一个案件认为属性是相同的,所以这项任务的标准量不是很大。

如此,会涉及两个任务:Attribute Predictor,Charge Predictor。下图为论文的模型图,分三个部分:

3.1 Text Encoder

Encoder

Text encoder 使用bi_lstm两层,然后得到文本的表征:


3.2 Attribute Predictor


将属性预测任务作为分类任务,类别数量为10

3.2 Charge Predictor

image.png

4 Experiment

在实验部分,作者将法律案件数据按太小分成三类进行实验测试。



对比方法用了cnn,lstm,TFIDF+SVM;cnn和lstm还考虑了词200维度,具体结果如下:


Experiment Result
从结果来看,论文提出的方法的确有明显提升,尤其在F1值上,说明该方法提升了少样本的识别效果。

5 结论

论文的借鉴之处:人工构造一个新任务且标注成本不是很高,然后进行多任务学习,子任务的作用就是辅助学习更有效的特征,进而提高主任务的预测效果,方法简单且有效。
但同时也会存在问题可以思考:

上一篇 下一篇

猜你喜欢

热点阅读