复旦大学团队发布中文智慧法律系统DISCLawLLM,构建司法评测基准,开源30万微调数据澎湃号·湃客澎湃新闻

随着智慧司法的兴起,智能化方法驱动的智能法律系统有望惠及不同群体。例如,为法律专业人员减轻文书工作,为普通民众提供法律咨询服务,为法学学生提供学习和考试辅导。

由于法律知识的独特性和司法任务的多样性,此前的智慧司法研究方面主要着眼于为特定任务设计自动化算法,难以满足对司法领域提供支撑性服务的需求,离应用落地有不小的距离。而大型语言模型(LLMs)在不同的传统任务上展示出强大的能力,为智能法律系统的进一步发展带来希望。

近日,复旦大学数据智能与社会计算实验室(FudanDISC)发布大语言模型驱动的中文智慧法律系统——DISC-LawLLM。该系统可以面向不同用户群体,提供多样的法律服务。此外,实验室还构建了评测基准DISC-Law-Eval,从客观和主观两个方面来评测法律大语言模型,模型在评测中的表现相较现有的法律大模型有明显优势。

课题组同时公开包含30万高质量的监督微调(SFT)数据集——DISC-Law-SFT,模型参数和技术报告也一并开源。

01样例展示

图1法律咨询示例

专业法律者和司法机关,可以利用模型完成法律文本摘要、司法事件检测、实体和关系抽取等,减轻文书工作,提高工作效率。

图2司法文书分析

法律专业的学生在准备司法考试过程中,可以向模型提出问题,帮助巩固法律知识,解答法律考试题。

图3考试助手示例

图4检索增强场景下的对话

02DISC-LawLLM介绍

DISC-LawLLM是基于我们构建的高质量数据集DISC-Law-SFT在通用领域中文大模型Baichuan-13B上进行全参指令微调得到的法律大模型。值得注意的是,我们的训练数据和训练方法可以被适配到任何基座大模型之上。

DISC-LawLLM具有三个核心能力:

2.法律推理思维能力。针对智慧司法领域任务的需求,我们使用法律三段论这一法官的基本法律推理过程重构了指令数据,有效地提高了模型的法律推理能力。

模型的整体框架如图5所示:

图5模型在不同的法律场景下服务于不同的用户

03方法:数据集DISC-Law-SFT的构造

图6DISC-Law-SFT的构造

DISC-Law-SFT分为两个子数据集,分别是DISC-Law-SFT-Pair和DISC-Law-SFT-Triplet,前者向LLM中引入了法律推理能力,而后者则有助于提高模型利用外部知识的能力。

表1:DISC-Law-SFT数据集内容介绍

指令对构造

行为塑造

在法律三段论中,大前提为适用的法律规则,小前提为案件事实,结论为法律判断。这构成了法官的一个基本的法律推理过程。每一个案例都可以通过三段论得出一个明确的结论,如下所述:

大前提:法律规则

小前提:案件事实

结论:法律判断

我们利用GPT-3.5-turbo来完成行为塑造的重构,细化输出,确保每个结论都从一个法律条款和一个案例事实中得出。

知识扩充

思维培养

思维链(CoT)已被证明能有效地提高模型的推理能力。为了进一步赋予模型法律推理能力,我们设计了具有特定法律意义的思维链,称为LCoT,要求模型用法律三段论来推导答案。LCoT将输入X转换为如下的提示:

在法律三段论中,大前提是适用的法律规则,小前提是案件事实,结论是对案件的法律判断。

案件:X

让我们用法律三段论来思考和输出判断:

指令三元组构造

为了训练检索增强后的模型,我们构造了DISC-Law-SFT-Triplet子数据集,数据为<输入、输出、参考>形式的三元组,我们使用指令对构造中列出的三种策略对原始数据进行处理,获得输入和输出,并设计启发式规则来从原始数据中提取参考信息。

04实验

训练

DISC-LawLLM的训练过程分为SFT和检索增强两个阶段。

检索增强

虽然我们使用了高质量的指令数据对LLM进行微调,但它可能会由于幻觉或过时的知识而产生不准确的反应。为了解决这个问题,我们设计了一个检索模块来增强DISC-LawLLM。

图7:检索增强的DISC-LawLLM

评测方法

评测基准DISC-Law-Eval

我们构建了一个公平的智能法律系统评估基准DISC-Law-Eval,从客观和主观的角度来评估,填补了目前还没有基准来对智能法律体系全面评估这一空白。

图8:DISC-Law-Eval评测基准

客观评测

为了客观、定量地评估智能法律系统的法律知识和推理能力,我们设计了一个客观的评价数据集,由一系列中国法律标准化考试和知识竞赛的单项和多项选择题组成,并根据内容复杂性和演绎难度,将问题分为困难、正常和容易三个层次。它可以提供一个更具挑战性和可靠的方法来衡量模型是否可以利用其知识来推理正确的答案。我们通过计算精度来表明性能。

主观评测

评测结果

比较模型

将我们的模型DISC-LawLLM(不外接知识库)与4个通用LLM和4个中文法律LLM进行比较,包括GPT-3.5-turbo、ChatGLM-6B、Baichuan-13B-Chat、Chinese-Alpaca2-13B;LexiLaw、LawGPT、LawyerLLaMA、ChatLaw。

客观评测结果

DISC-LawLLM在所有不同难度水平的测试中超过所有比较的同等参数量的大模型。即使与具有175B参数的GPT-3.5-turbo相比,DISC-LawLLM在部分测试上也表现出了更优越的性能。表2是客观评测结果,其中加粗表示最佳结果,下划线表示次佳结果。

表2:客观评测结果

主观评测结果

在客观评测中,DISC-LawLLM获得了最高的综合得分,并在准确性和清晰度这两项标准中得分最高。表3是主观评测结果,其中加粗表示最佳结果。

表3:主观评测结果

05总结

我们发布了DISC-LawLLM,一个提供多应用场景下法律服务的智能法律系统。基于公开的法律领域NLP任务数据集、法律原始文本和开源通用指令数据集,按照法律三段论重构了法律指令进行监督微调。为了提高输出的可靠性,我们加入了一个外部检索模块。通过提高法律推理和知识检索能力,DISC-LawLLM在我们构建的法律基准评测集上优于现有的法律LLM。该领域的研究将为实现法律资源平衡等带来更多前景和可能性,我们发布了所构建的数据集和模型权重,以促进进一步的研究。THEEND

投稿或寻求报道:content@jiqizhixin.com

原标题:《复旦大学团队发布中文智慧法律系统DISC-LawLLM,构建司法评测基准,开源30万微调数据》

THE END
1.司法观点法官评析等一键获取,海量数据尽在Alpha法律智能系统近期,法院相关部门的负责人在接受记者提问时,提到:“法院审理案件时必须查阅案例库,参考入库同类案例进而作出裁判,这样做的目的是可以做到保障法律的适用统一、裁判尺度统一,有效地避免出现‘同案不同判’的问题。”这意味着,未来的时间里,类案检索分析将成为法律人开展工作过程中极其重要的一环。 https://www.163.com/dy/article/IO3U5DDP0518WVJU.html
2.8月3日起,2020年专利代理师资格考试报名开始!(附考试大纲)产业考试试题采用简体汉字,香港特别行政区、澳门特别行政区、台湾地区应试人员可以使用繁体汉字作答,答题时应当使用国家法律、法规和规章所规定的专业术语。 (四)考试成绩公布、复查 专利代理师资格考试实行全国统一评卷,评卷结束后将公布考试成绩。应试人员可通过报名系统在指定期限内查询本人成绩。 http://m.iprdaily.cn/article_25279.html
3.北大法律信息网北大法宝北大法宝—中国法律检索系统(点击数据库名称进入高级检索) 中央法规司法解释高法公报案例条文释义new合同范本 地方法规规章裁判文书精选实务指南new法律文书样式 中外条约经典案例评析new法学教程立法背景资料new 外国与国际法律仲裁裁决与案例法学文献香港法律法规库 http://vip.chinalawinfo.com/
4.一文详解专利检索方法技术引进中的专利检索是一种综合性的检索,它是专利技术信息检索、专利权人检索、专利法律状态检索结合到一起交叉进行的专利信息检索,其目的是为对引进的技术做综合性评价提供依据。在早些年,我们大型企业在引进国外专利技术时,没有及时对国外让与公司的专利法律状态进行检索,高价收购了许多无效专利,给企业和国家造成了https://www.360doc.cn/article/80827975_1132967563.html
5.浅论LexisNexis数据库内容及价值Lexis.com是LexisNexis数据库中的在线检索系统,专门提供在线法令、判例、法案等法律方面的检索服务,内容非常丰富,所收文献涉及法律(Legal)、新闻和商业(News & Business )、公共信息(Public Records)三大领域。本文重点介绍其最富有特色的部分——法律文献。法律部分又分为以下五类:(1)美国法律文献(2)美国以外包括中国http://iolaw.cssn.cn/gyyd/200809/t20080929_4601416.shtml
6.检测人不知道新标准,新规范哪里查询?这些网站需要收藏了实验室管理14、食品安全国家标准数据检索平台 https://sppt.cfsa.net.cn:8086/db 15、食品安全抽检公布结果查询系统 https://spcjsac.gsxt.gov.cn/ 16、保健食品广告查询 http://adsc.samr.gov.cn/spyxggsc/SDAFAIS 17、验证电子营业执照 https://zzapp.gsxt.gov.cn/ https://www.foodmate.net/jianyan/3884/170255.html
7.大学生文献检索6篇(全文)大学生对网络文献的检索结果不满意,与各个网站、搜索引擎本身不无关系,大都缺乏相应的辅助检索服务。为了提高检索结果准确率,各网站、搜索引擎应当增加辅助检索服务。比如开设个人主页的建立功能,或允许检索者输入个人信息,比如院校、专业等,然后网站系统可以根据这些信息,辅助查找,并增加同院校、同专业领域相关文献的推送服https://www.99xueshu.com/w/filevebgz4lk.html
8.法律法规数据库法律法规检索系统北大法宝法律法规数据库,收录460余万件法律法规文件,来自《立法法》认可的权威文件来源,平均每日更新千余篇。是中国法律法规大全网站,同时是目前国内成熟、专业、先进的法律法规检索系统。http://cebbank.pkulaw.cn/
9.法律检索报告如何撰写(DOC)(精选4篇)建设高速公路与邻近居民区的距离,中国法律没有具体明确的限制性规定。 建设高速公路离居民区过近,小部分法院认为建设方应赔偿居民重建房屋的损失。 8、检索用时:xx小时 9、完成时间:2016年x月x日。 (作者注:本范例仅就检索报告的格式提供参考,其中的检索内容作了大量删减,检索结论亦不作为本律师及所在律师事务所https://www.360wenmi.com/f/file846ihcg3.html
10.中国系统法学研究回顾与展望/李宝明中国系统法学研究回顾与展望 李宝明 一、系统法学流派的兴起与现状 将系统科学引入法学领域的尝试,自系统科学问世之初就已经开始。一般认为,控制论创始人维纳所著《人有人的用处——控制论与社会》一书,是系统科学与法学的最早结合。维纳运用控制论的一般原理对有关法律、正义、道德、社会控制等问题所作的“纯技术性https://www.fwsir.com/fl/html/fl_20061126174710_10819.html