基于区别性的法律属性来预测少样本的法律案件

2020-07-07 本文已影响0人烛之文

1 前言

这次分享一篇关于法律案件预测的paper，发表在2018年COLING会议上。论文标题为：Few-Shot Charge Prediction with Discriminative Legal Attributes，论文下载链接。因为关于法律案件的预测问题已有很多相关的paper, 为此，作者基于该任务提出了两点创新：一是增加Discriminative Legal Attributes识别任务，来辅助提高Charge Prediction任务；二是解决一些标签少样本(Few-Shot)的问题。

2 任务背景

在法律案件预测任务中，常常面临有些案件样本数量很少，有些案件彼此特别接近，例如:(theft, robbery) and (misappropriation of funds, embezzlement)。
基于上述问题，作者提出多任务学习框架，增加区别性法律属性预测任务(Discriminative Legal Attributes )，进而学习更有效的特征，提升法律案件预测(Charge Prediction)。

基于属性的法律案件预测思路

3 Model

作者提出的十类属性

作者提出10个属性特征，在标注的时候，采用(YES,NO)的二分类；同一个案件认为属性是相同的，所以这项任务的标准量不是很大。

如此，会涉及两个任务：Attribute Predictor，Charge Predictor。下图为论文的模型图，分三个部分：

Text Encoder
Attribute Predictor
Charge Predictor

模型的架构图

3.1 Text Encoder

Encoder

Text encoder 使用bi_lstm两层，然后得到文本的表征:

3.2 Attribute Predictor

将属性预测任务作为分类任务，类别数量为10

3.2 Charge Predictor

image.png

4 Experiment

在实验部分，作者将法律案件数据按太小分成三类进行实验测试。

对比方法用了cnn，lstm，TFIDF+SVM；cnn和lstm还考虑了词200维度，具体结果如下：

Experiment Result
从结果来看，论文提出的方法的确有明显提升，尤其在F1值上，说明该方法提升了少样本的识别效果。

5 结论

论文的借鉴之处：人工构造一个新任务且标注成本不是很高，然后进行多任务学习，子任务的作用就是辅助学习更有效的特征，进而提高主任务的预测效果，方法简单且有效。
但同时也会存在问题可以思考：

虽然标注成本不是很高，但提出的十个Discriminative Legal Attributes 并非容易的事情，需要很强的领域知识；
论文并没有对比预训练模型BERT，或者在预训练模型的微调上也能达到这样的效果；
其实法律案件有些是属于多标签的，这个文章也没考虑；

上一篇下一篇

猜你喜欢

热点阅读