LEVEN：一个大规模的中国法律事件检测数据集|中国法律类型_法律

识别事实是做出判断的最基本步骤，因此检测法律文件中的事件对法律案件分析任务非常重要。然而，现有的法律事件检测（LED）数据集只涉及不全面的事件类型，而且注释的数据有限，这限制了LED方法的发展及其下游应用。为了缓解这些问题，我们提出了LEVEN，一个大规模的中国法律事件检测数据集，包括8116份法律文件和108个事件类型中的150977个人类注释的事件提及。不仅是与指控有关的事件，LEVEN还涵盖了一般事件，这些事件对法律案件的理解至关重要，但在现有的LED数据集中却被忽略了。据我们所知，LEVEN是最大的LED数据集，其数据规模是其他数据集的几十倍，这将大大促进LED方法的训练和评估。广泛的实验结果表明，LED具有挑战性，需要进一步努力。此外，我们只是利用法律事件作为侧面信息来促进下游的应用。该方法在低资源判决预测中实现了平均2.2分的精度改进，在无监督案件检索中实现了平均1.5分的精度改进，这表明LED的基础性。

法律事件检测找出发生的事件及其之间的因果关系，是分析法律案件和作出判断的基础。法律事件检测（LED）旨在从法律案件中自动提取事件触发词，然后对其对应的事件类型进行分类，这个任务有利于许多下游法律人工智能应用，例如法律判决预测（LJP）和类似案件检索（SCR）。

现有LED数据集的不足：（1）数据有限：现有的LED数据集仅包含数千个事件提及注释，无法提供足够的训练数据和可靠的评估结果。（2）不全面的事件模式：现有的LED数据集仅涉及十几种罪名事件类型，只覆盖了很小的范围。

LEVEN的优点：（1）规模大：包含8116份法律文件，涵盖118项刑事指控，并有150977次人工注释事件提及；（2）高覆盖率：包含108种事件类型，指控类事件64种，一般类事件44种

第二阶段：为每项刑事指控抽出20份案件文件，邀请一位法律专家对抽样案件中出现的事件进行人工提取和总结。根据提取的事件，进一步过滤掉抽象的事件类型，最终得到了108个事件类型的注释，其中包括面向指控的事件和一般事件。

根据犯罪理论，犯罪的关键因素包括行为、危害结果和它们之间的因果关系。因此，本数据集将事件类型组织成一个分层结构，有三个类别代表行为，一个类别代表结果。

采用启发式方法自动选择候选触发词，并且缩小每个触发词候选项的事件类型选项。

根据注释指南，邀请多名注释者进行多阶段的注释，得到高质量的标注结果。

事件模式包含三个代表行为的事件类别，两个代表结果的事件类别，以及一个代表不可抗力的事件类别。

89.6%的事件类型包含100个以上的事件提及，43.4%的事件类型包含1000个以上的事件提及。

按照0.65:0.15:0.2的比例，将数据集随机分成训练集、验证集和测试集，采用微平均和宏平均的精度、召回率和F1得分作为实验的评价指标。

分类：用BiLSTM和BERT对给定的句子进行编码，用候选触发器的隐藏表示对其相应的事件类型进行分类。

动态池化：采用卷积神经网络（DMCNN）或者BERT来提取序列特征，并采用动态池化层来获得每个候选者的特定触发词表示。

长尾问题：虽然LEVEN包含数十万个事件提及，但有一些事件类型的实例不可避免地有限。少于50个实例的事件类型的micro-F1得分是65.97%，少于100个实例的事件类型是72.24%，低频类型的性能与总体平均性能之间仍有很大差距。

选用BERT作为基本结构，对词嵌入做出微小的改动，以整合事件信息。

采用BERT+CRF模型来检测案例文档中的触发词及其事件类型。通过在输入嵌入层中添加事件类型嵌入来利用BERT模型中的事件信息。事件类型嵌入在训练过程中被随机初始化和更新。

LED可以促进LJP的性能，尤其是在低资源环境下，这证明了LED的有效性。在完整的训练数据集下，LED只能在指控预测和法律条文预测上取得微弱提高，而在期限预测上取得显著提高。

事件信息有助于提高BERT模型的性能，进一步证明了事件信息对案例检索的重要性。

[1]CollinF.Baker,CharlesJ.Fillmore,andJohnB.Lowe.1998.TheBerkeleyFrameNetproject.InCOLING1998Volume1:The17thInternationalConferenceonComputationalLinguistics.

[2]AndersonBertoldi,RoveChishman,SandroJoséRigo,andThaísDomênicaMinghelli.2014.Cognitivelinguisticrepresentationoflegalevents.ProceedingsofCOGNITIVE.

THE END

LEVEN：一个大规模的中国法律事件检测数据集

中国的法律有哪些分类？

我国的法律有哪些种类?

王志强类型化分析与中国法律史学

律师常用法律援助咨询辅助人员软件分享司法辅助免费法律咨询比较好的软件推荐[图文]

关于我国的法律移植问题浅探

法律的强制作用范文

全国自考08118法律基础历年真题及答案汇总（附资料）

中国法下的再保险合同法律问题

经典霍华德·马克斯等：当下还未有过多被迫抛售现象，寻找这类与中国联系紧密的投资机会

LEVEN：一个大规模的中国法律事件检测数据集

中国法学会部级课题情况介绍

上海律师APP全新升级，超强功能你会用吗？法律法条条文立法上海市司法赔偿案件

中华人民共和国公务员法（最新2017版）国家法类

2016考研法律硕士（法学）考试大纲第2页考研大纲解析

法律服务种类范文

法学基础知1

民事法律关系的类型范文