挤爆服务器,北大法律大模型ChatLaw火了:直接告诉你张三怎么判澎湃号·湃客澎湃新闻

语言大模型不断向垂直行业领域拓展,这次出圈的是北大法律大模型。

大模型又「爆了」。

一个法律大模型ChatLaw登上了知乎热搜榜榜首。热度最高时达到了2000万左右。

这个ChatLaw由北大团队发布,致力于提供普惠的法律服务。一方面当前全国执业律师不足,供给远远小于法律需求;另一方面普通人对法律知识和条文存在天然鸿沟,无法运用法律武器保护自己。

目前,ChatLaw共有三个版本,分别如下:

ChatLaw-13B,为学术demo版,基于姜子牙Ziya-LLaMA-13B-v1训练而来,中文各项表现很好。但是,逻辑复杂的法律问答效果不佳,需要用更大参数的模型来解决;

ChatLaw-33B,也为学术demo版,基于Anima-33B训练而来,逻辑推理能力大幅提升。但是,由于Anima的中文语料过少,问答时常会出现英文数据;

ChatLaw-Text2Vec,使用93w条判决案例做成的数据集,基于BERT训练了一个相似度匹配模型,可以将用户提问信息和对应的法条相匹配。

根据官方演示,ChatLaw支持用户上传文件、录音等法律材料,帮助他们归纳和分析,生成可视化导图、图表等。此外,ChatLaw可以基于事实生成法律建议、法律文书。该项目在GitHub上的Star量达到了1.1k。

目前,由于ChatLaw项目太过火爆,服务器暂时崩溃,算力已达上限。该团队正在修复,感兴趣的读者可以在GitHub上部署测试版模型。

小编本人也还在内测排队中。所以这里先展示一个ChatLaw团队提供的官方对话示例,关于日常网购时可能会遇到的「七天无理由退货」问题。不得不说,ChatLaw回答挺全的。

不过,小编发现,ChatLaw的学术demo版本可以试用,遗憾的是没有接入法律咨询功能,只提供了简单的对话咨询服务。这里尝试问了几个问题。

其实最近发布法律大模型的不只有北大一家。上个月底,幂律智能联合智谱AI发布了千亿参数级法律垂直大模型PowerLawGLM。据悉该模型针对中文法律场景的应用效果展现出了独特优势。

图源:幂律智能

首先是数据组成。ChatLaw数据主要由论坛、新闻、法条、司法解释、法律咨询、法考题、判决文书组成,随后经过清洗、数据增强等来构造对话数据。同时,通过与北大国际法学院、行业知名律师事务所进行合作,ChatLaw团队能够确保知识库能及时更新,同时保证数据的专业性和可靠性。下面我们看看具体示例。

基于法律法规和司法解释的构建示例:

抓取真实法律咨询数据示例:

律师考试多项选择题的建构示例:

然后是模型层面。为了训练ChatLAW,研究团队在Ziya-LLaMA-13B的基础上使用低秩自适应(Low-RankAdaptation,LoRA)对其进行了微调。此外,该研究还引入self-suggestion角色,来缓解模型产生幻觉问题。训练过程在多个A100GPU上进行,并借助deepspeed进一步降低了训练成本。

如下图为ChatLAW架构图,该研究将法律数据注入模型,并对这些知识进行特殊处理和加强;与此同时,他们也在推理时引入多个模块,将通识模型、专业模型和知识库融为一体。

该研究还在推理中对模型进行了约束,这样才能确保模型生成正确的法律法规,尽可能减少模型幻觉。

当用户的问题模糊不清时,这种方法通常会产生次优的结果。因此,研究者从用户查询中提取关键信息,并利用该信息的向量嵌入设计算法,以提高匹配准确性。

实验结果

该研究收集了十余年的国家司法考试题目,整理出了一个包含2000个问题及其标准答案的测试数据集,用以衡量模型处理法律选择题的能力。

然而,研究发现各个模型的准确率普遍偏低。在这种情况下,仅对准确率进行比较并无多大意义。因此,该研究借鉴英雄联盟的ELO匹配机制,做了一个模型对抗的ELO机制,以便更有效地评估各模型处理法律选择题的能力。以下分别是ELO分数和胜率图:

通过对上述实验结果的分析,我们可以得出以下观察结果

(2)加入特定类型任务的数据进行训练,模型在该类任务上的表现会明显提升。例如,ChatLaw模型优于GPT-4的原因是文中使用了大量的选择题作为训练数据;

(3)法律选择题需要进行复杂的逻辑推理,因此,参数量更大的模型通常表现更优。

参考知乎链接:

其他参考链接:

投稿或寻求报道:content@jiqizhixin.com

原标题:《挤爆服务器,北大法律大模型ChatLaw火了:直接告诉你张三怎么判》

THE END
1.法律大模型及案例介绍法律大模型是指专门针对法律领域的人工智能模型,它在通用大模型的基础上,使用高质量的法律数据进行微调,以提高模型在法律问答、文本生成、案例分析等任务上的专业性和准确性。以下是关于法律大模型的详细介绍: 一、定义与特点 法律大模型是一种基于深度学习技术的人工智能模型,它利用海量的法律文本数据进行预训练和微调https://blog.csdn.net/2402_84466582/article/details/140094041
2.智爱法律大模型可针对每个用户的特点培养专属法律大模型 律师工作的降本增效 律师可直接使用AI功能模块提高工作效率 执业领域的加强补足 为客户提供AI法律服务产品,提升竞争力 知识技巧的留存沉淀 使用中不断进化,更加符合律师使用习惯 为什么选择智慧律师? 真正使用大模型的AI技术 https://www.zhiexa.com/home/
3.chatlaw法律大模型官网,智法网页版入口,下载,基于中文法律条文ChatLaw 是一个基于各种中文法律条文、实际案例、判决条文所训练出来的法律大模型,可借助 AI,实现法律合同撰写、案例介绍、条款讲解、司法问题咨询等场景。ChatLaw(智法)模型由北大-兔展AIGC联合实验室和北京大学信息工程学院袁粒课题组联合发布。基于超过2亿的判例文书原始文本,以及340万条法律法规和地方政策,构建了大https://biemoyu.com/sites/chatlaw.html
4.ChatLaw法律大模型中文法律大模型ChatLaw是一个基于深度学习和自然语言处理技术的中文法律大模型,模型支持文件、语音输出,同时支持法律文书写作、法律建议、法律援助推荐。ChatLaw 法律大模型通过分析大量的法律新闻、法条、判决文书等数据来提供法律服务。该模型能够帮助用户撰写法律合同、解释法律条款、提供司法问题咨询,并支持法律文书的撰写和法律建议。https://www.bgrdh.com/sites/24904.html
5.北大兔展联合实验室发布中文法律大模型ChatLaw,为大众提供普惠最近,由北京大学信息工程学院袁粒课题组 与 北大-兔展AIGC联合实验室 联合发布的中文法律大模型产品ChatLaw,就为普通人提供了获取普惠法律服务的途径。 用户通过简单对话,即可获得较为专业的法律建议。 甚至提供专业的法律文书。 与此同时,它在网页上即可使用,没有次数限制,还能读取文件和音频,提供专业法律文书、推荐https://m.cyzone.cn/article/731575.html
6.「翊天」法律大模型极客公园在软件生态产品论坛上,作为国内法律大模型领域的领军企业,图灵微雀云重磅推出翊天律师智能助手——全国首个围绕律师诉讼业务全流程的 AI 智能助手,旨在为法律服务行业带来前所未有的创新与变革。 科技速递 七日热门 1 智谱放大招:大模型从「Chat」走向「Act」 2 售价百万鸿蒙尊界 48 小时预订 2108 台;快手停用https://www.geekpark.net/tags/%E3%80%8C%E7%BF%8A%E5%A4%A9%E3%80%8D%E6%B3%95%E5%BE%8B%E5%A4%A7%E6%A8%A1%E5%9E%8B
7.探索国内法律大模型的先行者:得理科技的AI赋能之旅1. 法律咨询:得理法律大模型可以处理高频的法律咨询业务,包括公司常年顾问服务和普通民众的法律纠纷咨询。 2. 法律文书写作:得理法律大模型能够撰写各种法律文书,如合同、起诉状、答辩状和法律分析意见。 3. 案例分析:得理法律大模型可以进行案情分析,帮助预测法官的判决,了解法律规定和研究过去的案例。 https://www.iyiou.com/news/202406061068815
8.ChatLawChatLaw是由北京大学团队开发的开源法律大语言模型(LLM),它通过结合法律领域特定的数据集和外部知识库,旨在提高法律问题处理的准确性和效率。该模型利用先进的自然语言处理技术,能够理解和生成法律相关的咨询和解答,同时减少法律数据筛选中的模型幻觉问题。ChatLaw的设计考虑了法律语言的复杂性和法律知识更新的快速性,力图https://ai-bot.cn/sites/11444.html
9.讯飞星火法律大模型全国产化自主可控讯飞星火法律大模型,探索智慧法治新模式,共筑司法新质生产力 产品介绍 应用 模型 法律咨询 构建涵盖法律意见咨询、策略指引、材料编写等综合服务应用,提供全方位法律支持。 法律检索 基于法律情境精准检索相关法规及典型案例,提供法律观点及研究指引,助力法律决策。 https://www.xinghuolegal.com/
10.中国首个应用级法律大模型!通过国家网信办备案审查中国首个应用级法律大模型!通过国家网信办备案审查 近日,北京大学法律人工智能实验室自主研发的“元法大模型”成功通过国家网信办的生成式人工智能(大语言模型)上线备案审查,成为国内法律垂直领域首个获得国家主管部门备案的AI大模型。 “元法大模型”采用了首创的规则推理引擎技术,并经历了七百亿级参数的预训练。该https://essentialslink.cn/doc/docView?id=4848
11.对话丨ChatLaw团队袁粒:做普通人也能用的法律大模型雷峰网让ChatLaw 变成最专业的法律大模型 AI科技评论:专业数据对于大模型的垂直领域场景理解至关重要,ChatLaw 在数据收集的角度,做了哪些努力? 袁粒:法律领域相较其他比较特殊——很多最高质量的数据,都是公开数据。这其中就包括法律法规、判例文书、司法解释等等。我们的数据处理,主要就是基于这些公开的数据。 https://www.leiphone.com/category/aijuejinzhi/qqggTwkYCtxfuriP.html