基于区别性的法律属性来预测少样本的法律案件
2020-07-07 本文已影响0人
烛之文
1 前言
这次分享一篇关于法律案件预测的paper,发表在2018年COLING会议上。论文标题为:Few-Shot Charge Prediction with Discriminative Legal Attributes,论文下载链接。因为关于法律案件的预测问题已有很多相关的paper, 为此,作者基于该任务提出了两点创新:一是增加Discriminative Legal Attributes识别任务,来辅助提高Charge Prediction任务;二是解决一些标签少样本(Few-Shot)的问题。
2 任务背景
- 在法律案件预测任务中,常常面临有些案件样本数量很少,有些案件彼此特别接近,例如:(theft, robbery) and (misappropriation of funds, embezzlement)。
-
基于上述问题,作者提出多任务学习框架,增加区别性法律属性预测任务(Discriminative Legal Attributes ),进而学习更有效的特征,提升法律案件预测(Charge Prediction)。
基于属性的法律案件预测思路
3 Model
作者提出的十类属性作者提出10个属性特征,在标注的时候,采用(YES,NO)的二分类;同一个案件认为属性是相同的,所以这项任务的标准量不是很大。
如此,会涉及两个任务:Attribute Predictor,Charge Predictor。下图为论文的模型图,分三个部分:
- Text Encoder
- Attribute Predictor
-
Charge Predictor
模型的架构图
3.1 Text Encoder
EncoderText encoder 使用bi_lstm两层,然后得到文本的表征:
3.2 Attribute Predictor
将属性预测任务作为分类任务,类别数量为10
3.2 Charge Predictor
image.png4 Experiment
在实验部分,作者将法律案件数据按太小分成三类进行实验测试。
对比方法用了cnn,lstm,TFIDF+SVM;cnn和lstm还考虑了词200维度,具体结果如下:
Experiment Result
从结果来看,论文提出的方法的确有明显提升,尤其在F1值上,说明该方法提升了少样本的识别效果。
5 结论
论文的借鉴之处:人工构造一个新任务且标注成本不是很高,然后进行多任务学习,子任务的作用就是辅助学习更有效的特征,进而提高主任务的预测效果,方法简单且有效。
但同时也会存在问题可以思考:
- 虽然标注成本不是很高,但提出的十个Discriminative Legal Attributes 并非容易的事情,需要很强的领域知识;
- 论文并没有对比预训练模型BERT,或者在预训练模型的微调上也能达到这样的效果;
- 其实法律案件有些是属于多标签的,这个文章也没考虑;