法律界的AI革命:大模型将如何颠覆游戏规则?判例律师

法律行业自古有之,是一个相对保守且精英化的行业,不论在对新科技的采用还是整体的线上化,都相对较慢;LegalTech(法律科技)也一直是一个相对价值较“薄”的行业,虽然也支撑起诸如LegalZoom、DocuSign等上市公司,但相比Martech(营销科技)、Fintech(金融科技)等行业,发展较为缓慢。

然而我们发现,生成式AI大模型,如GPT-4、Claude、GLM,基于其较好的复杂推理能力与非结构化信息处理上,拥有前所未有的能力;而法律恰恰有大量非结构化文本沉淀且对推理能力要求较高、是智力密集型行业,以律师的billinghours为核心的价值提供,因此新科技如生成式AI或将为行业大幅降本增效,提供足够显性且有破坏性的价值,而迅速成为Legaltech的重要一部分。

本文,我们深度聚焦AI法律领域,结合海外的最新动向,以发掘出潜在的创业与投资机会,Enjoy~

(图绘制自Midjourney)

行业引爆点Hook

1.知识和推理能力上的爆发:美国伊利诺伊理工大学-芝加哥肯特法学院宣布,GPT-4通过了美国律师资格考试、并且成绩排名上超过90%的考生,而上一代GPT-3.5参加该考试还排在倒数10%,意味着LLM在法律垂类知识和推理能力上正式完成从零到一的跃迁。

2.投融资的爆发:Harvey拿到OpenAIStartupFund的首轮融资500万美元,以及红杉资本领投、OpenAIStartupFund跟投的2100万美元,正式引爆AI法律的创投行业热潮。

行业Overview

法律行业原有状况:LegalTech在LLM爆火之前,主要有2波浪潮

2.2012-2020年,AI开始更多介入LegelTech领域,带来平台级的提升,一些典型的公司包括ContractPodAI和DISCO等,通过LegalTech产品直接为客户提供法律服务,初步减少了咨询律师的需求并降低了律师与客户双边匹配的成本。

虽然之前已有两波浪潮,但整体来看,法律行业依旧处在技术渗透率和在线化率低的情况,仅8%;我们判断有以下两点核心原因:

1.法律行业的工作流定义明确+价值高,但对幻觉的容忍度/准确率要求高,因此难以做出generalizedtools-甚至律所及律师的工作习惯还停留在用word和email等传统工具上。

2.受传统规则(工作方式传统)和商业模式(按照小时付费)约束较大,因此技术渗透率和在线化率低。

后验来看,的确如此。之前LegalTech的核心价值来自电子签名和合同管理等细分领域,聚焦法律服务细分环节的深挖,以捕捉尽可能高比例的价值,如于2018年上市的DocuSign,拥有140万个客户和27亿美元的营收,占据了70%的电子签名市场,但天花板依旧受限于市场规模

法律行业能够被生成式AI颠覆的原因

核心逻辑:有降本增效的需求+中长尾未被满足的c端需求,二者相加可能有十倍以上的增量价值

1.降本增效的强烈需求来自于巨大的行业规模以及行业的昂贵人力成本以及routinepaperwork被AI替代的潜力

2.中长尾有大量未被满足的需求(accesstojustice):法律专业服务的门槛被降低(AI带来的供给增加以及成本降低)、因此更多c端用户可以access到优质法律服务

3.高标准化+本身价值高的的需求将先被serve,比如诉讼业务

海内外法律服务市场的核心差异

市场差异

1.海内外的TO-B/To-L市场上,海外更成熟、中国相对初期:1)海外的SaaS更成熟、云化好/线上化成熟;因此To-B更可能做出东西2)国内的SaaS一直存在天花板低,付费意愿差,头部客户以央国企的定制化需求为主,因此更难scale。

法律体系差异

1.判例法vs成文法:美国对判例查询,以及判例的积累作为数据壁垒的意义更:美国及海洋法系国家是判例法,倚重于大量的过往的判罚案例;而中国的判案更多依据法律条文本身,过往判例更多起到辅助作用。

2.人力成本问题:美国律师的人力成本非常高、美国的律师行业一直是诸多上中产阶级的理想工作,高收入且体面;因此采用AI来替代人工降本增效有更强的动力;而中国则有更多青年律师、实习生提供来满足简单、高重复性的paperwork。

海外市场竞争格局

核心分为三类:三者均有AI法律的头部产品跑出

核心公司分析

1.Harvey:拥有LLM专家和资深律师的顶级复合背景,以及OpenAI的官方背书,通过为客户构建定制模型,以提供效果更优的通用律师Copilot,在LLM法律行业中处在头部领先地位

公司简介:2022年1月成立于美国华盛顿特区,专注于为通过法律Copilot的形式,为律所和律师提升工作效率,包括使用AI替代研究、起草、分析等paperwork。

创始团队:「Harvey」由WinstonWeinberg和GabrielPereyra两人联合创立,前者曾是O’Melveny&Myers律师事务所的证券和反垄断诉讼律师,后者曾是DeepMind、GoogleBrain和MetaAI的研究人员。两人在接触到OpenAI的GPT-3文本生成系统后,意识到可以利用这一技术改善法律工作流程。

产品情况:通过fine-tune过的法律专家大模型,帮助律师完成合同分析、监管合规、索赔管理、尽职调查及更广泛的法律咨询服务;专注于为客户构建定制模型,以达到更好的效果。

技术路线:基于GPT-4进行fine-tune,为最早接入GPT-4大模型的公司之一;最终输出需要经由律师的审查,以保证产出结果及隐私保护。

业务数据:客户主要为大律所和其他有强法律需求的专业机构,如国际律所Allen&Overy和头部会计师事务所普华永道,其中一半的应用来自于北美;目前已经有超过1.5万家机构在其waitlist上。

融资情况:Harvey累计融资2600万美元,目前估值为1.5亿美元。在获得OpenAI领投的500万美元天使轮融资后,Harvey又获得了红杉资本领投的2100万美元A轮融资,其他投资方包括OpenAIStartupFund、SVAngel和EladGil等。

竞争优势:1)OpenAI资源扶持优势:由于较早拿到了OpenAI的投资,在大模型fine-tune和使用上有先发和协同优势2)创始团队拥有法律和大模型的复合背景:在大模型在垂类的应用上有显著knowhow优势。

2.Casetext-CoCounsel:团队拥有较强的AI和法律复合背景,同时拥有资深的法律行业资源和来自汤森路透(WestLaw)的协同效应,聚焦通用律师Copilot,和Harvey是直接竞争关系

公司简介:Casetext于2013年成立于美国旧金山湾区,CoCounsel是Casetext的一款基于GPT-4的AI法律助理产品,于2023年推出;目前Casetext已经被汤森路透(知名媒体路透社的母公司,本身拥有LegalTech产品WestLaw)收购。

创始团队:公司的CEO为JakeHeller,曾在R&G做助理律师;技术Heads:CTO为RyanWalker,HeadofMachineLearning为MartinGajek,都曾在InsightDatascience担任核心技术岗位。

产品情况:CoCounsel推出了两款AI法律产品,分别为AI案例分析助理CARA(CaseAnalysisResearchAssistant)及AI法律搜索工具Parallel,致力于帮助律师查询法律文件、准备证词、生成法律memo、总结内容和提取法律合同数据功能。

技术路线:Casetext同样是第一批接入GPT-4大模型API的公司,并基于GPT-4模型进行了fine-tune,将大约3000个法律问题进行了大约4000个小时的训练,以提高其专业能力与准确性。

业务数据:CoCounsel已经在全球范围内的顶尖律师事务所、内部法律部门和法律援助组织中进行了beta测试,测试人员超过400名律师,已知的客户包括FisherPhillips、EvershedsSutherland、BowmanandBrookeLLP和Orrick,Herrington&SutcliffeLLP等。

融资情况:2023年6月,汤森路透以6.5亿美元现金收购了Casetext;2022年1月完成2500万美元的C轮融资,由BuildGroup领投,UnionSquareVentures、CanvasVentures、YCombinator和TouchdownVentures等跟投。

竞争优势:1)数据积累优势:Casetext本身就有10年的服务律所的经验,与汤森路透的强强联手意味着其拥有世界级的专业法律知识库2)客户资源沉淀:Casetext已经与全球范围内的顶尖律师事务所、内部法律部门和法律援助组织建立了合作关系,有利于快速获取客户3)加密保护:使用专属服务器访问GPT-4并采用了银行级AES-256进行数据加密保护,以保护客户数据安全。

3.LexisNexis-LexisAI+:老牌服务商切入AI法律领域,核心优势为海量的法律数据以及定制化的LLM全栈,旨在基于其对行业的深度洞察更好的为头部律所提供AI服务

公司简介:LexisNexis(律师联讯)是一家老牌的英国法律服务提供商,为励讯集团(RELXGroupPLC)的子公司,于今年五月推出了基于LLM的法律AI平台,Lexis+AI,旨在提供合同生成、法律内容总结于搜索的便捷功能,提高工作效率。

创始团队:JakeNelson为LexisAI+的核心产品负责人,曾任Omnificent的CEO,精通于语义搜索和预测等机器学习技术的同时,对搜索产品较为了解。

产品情况:聚焦于法律行业的AI搜索,同时提供生成摘要、法律文件等能力,并会对相应的内容进行引用标注,以帮助律师和客户得到可验证、也引用的权威认证。

技术路线:没有使用单一模型、而是根据特定任务选择不同LLM(包括GPT-4等),已形成更有针对性且成本效益更好的LLM全栈业务数据:公司客户主要为头部国际律所,如全球Top1的BakerMcKenzie和ReedSmithLLP

竞争优势:1)数据积累优势:拥有2500TB的巨量数据,几乎掌握了全球法律界所有核心数据,包括1440亿份文件和记录、拥有2.93亿份法庭案卷和文件、超过1.59亿份专利文件等2)基于行业knowhow定制的LLM全栈:而不是单一的LLM,以更好的满足场景的准确性及效率需求3)私有部署解决安全疑虑:公司针对每一个客户,都采用1v1私有部署模式,不会与任何第三方共享数据

4.Donotpay:另辟蹊径的B2C法律Chatbot,通过创新性的产品和流量牵引力为法律服务降低门槛以更好满足中长尾的法律诉求

公司简介:Donotpay于2015年推出便聚焦于为C端提供服务,定位为“RoboLawyer",旨在满足普通C端用户的中长尾法律需求,如为难民申请庇护、为流浪人员申请住房等;DoNotPay平台最初是为了帮助英美客户对于违规停车罚单进行上诉,后来服务内容逐渐扩展。

创始团队:JoshuaBrowder为公司的创始人兼CEO,创立公司时刚刚加入斯坦福(随后Dropout),年仅18岁,父亲为著名的金融家BillBrowder;目前也是美国头部VCGreylock的EIR(EntrepreneurinResidence)。

产品情况:Donotpay的核心产品形态是一个具有法律专业知识的AIChatbot,只需要订阅即可获取其智能化的法律服务,如各类法律建议和解决方案,具体场景包括挑战违章停车罚单、申请航班退款、取消健身房会员等。

业务数据:Donotpay平台直接向来自英美的C端客户提供订阅制服务,一个月的价格仅为2.4英镑;虽然现在没有明确的营收数据,但仅仅是取消健身房会员方面的起诉需求上(由于疫情,许多健身房关门)就有了30倍以上的飙升。

融资情况:2021年8月,公司完成了由CrewCapital领头的1000万美元B轮融资,估值达到了2.1亿美元;此前公司已经融资超过1600万美元,包括由Coatue领投的1200万美元A轮融资,以及更早来自AndreessenHorowitz、LuxCapital等的种子轮。

竞争优势:1)直接To-C的产品具有创新性:通过法律服务帮助用户满足法律需求并节省各类开支,因此用户由很高的付费意愿与粘性2)创始人为“小天才”画像:JoshuaBrowder是StanfordDropout,擅长洞察C端需求与产品创新。

核心成功因素KSF

结合以上四家以及Spellbook、Evenup、RobinAI等其他海外LLM法律头部公司,以及国内的幂律智能、语炎智能等获得融资的LLM法律公司,我们发现,公司最为核心的能力主要包括以下五点

2.行业专业数据:对于LLM法律公司来说,能够训练出优质专业LLM的前提是能够更好积累较为优质的垂类数据,否则会Garbagein,Garbageout;同样,如果想积累优质的专业向量数据库用于AI检索,也依赖于优质的数据积累,如LexisAI+借助母公司LexisNexis的帮助能够更好的获取和使用数据、Casetext借助其之前的客户资源和汤森路透的产业协同也能获得大量优质的垂类数据

3.创始团队画像:LLM法律的创业对创始团队的要求极高,需要同时拥有LLM和法律垂类知识的顶级复合背景,而其中Harvey通过WinstonWeinberg和GabrielPereyra两位的顶级AI专家+顶级律师的复合背景,拥有目前LLM法律创业项目中最顶级的团队配置之一,拥有领先的LLM和法律knowhow,从而能更好满足律所和企业客户的需求。

4.产品化及Go-to-Market的能力:产品化能力为目前所有LLM+垂类行业的重中之重,如何在大模型提供民主化的核心智能、以及数据壁垒不明显的情况下,做出产品来更好且快的满足客户需求成为了公司的核心能力;不论是还在内测的Harvey,还是国内的几家公司,都拥有做出优秀产品的潜质;而如何更好的Go-to-Market也至关重要,不论是早期冷启动获得头部订单以快速转动数据和业务飞轮,还是选择整条法律服务价值链的切入点(如诉讼业务通常更复杂、有更高价值,如果消耗资源类似,应该优先选择)。

5.数据安全问题的解决:由于法律行业本身数据非常敏感,聘请律所提供法律服务的企业客户通常会担心自己的隐私数据泄漏,甚至成为LLM训练数据的一部分,LLM法律公司会使用人为最终审查(由律师)、高级别加密保护、服务器隔离、私有化部署等方式以消除客户疑虑,谁能在数据安全与隐私上赢得客户信任也将成为重要的竞争因素。

潜在风险

1.数据隐私问题(privacylaws):客户担心自己的隐私数据变成训练LLM的一部分,因此如何通过人为最终审查(由律师)、高级别加密保护、服务器隔离、私有化部署等方式,以及对客户的教育,成为能否获得头部标杆客户及广泛市场认可的关键。

2.LLM幻觉问题:生成新text上,出现幻觉概率更高;解决方案包括用大量法律数据集进行fine-tune,使用向量数据库等,但目前依旧没有特别完美的解决方案。

3.国内特有的海外模型使用限制及相应的大模型与产品备案:目前来看,中国to-B的GPT应用依旧属于灰色地带,如果在国内提供服务的AI法律公司需要认真审视相应风险;而关于备案,则应该紧跟新增的法规,如8月15日新出的大模型备案规则。

一点未来推演...

AITools-AICopilot-AIAgent-AIeverything的发展趋势

1.AITools阶段:LLM爆发之前的LegalTech属于这个阶段,如DocuSign:在这个阶段,技术主要是作为工具存在,例如文本编辑器、数据库搜索引擎等,这些工具在律师的日常工作中起到辅助作用。这些工具没有智能,只是简化了信息检索和文档编辑等任务。

2.AICopilot阶段:LLM爆发之际的AILegalTech属于此,包括Harvey、Cocounsel、Donotpay:目前,我们正处于这个阶段,其中包括像Harvey和Casetext/CoCounsel这样的产品。这些产品使用AI和大型语言模型(如GPT-4)来进行更复杂的任务,例如法律研究、合同分析和证词准备。这些产品不仅仅是工具,它们更像是“副驾驶员”,能够理解复杂的法律问题并给出专业建议。

4.AIEverything阶段:甚至包括本来高价值的诉讼环节,都可能被法律专家LLM+人形机器人所替代:在这个极端的阶段,AI将足够智能,以至于可以替代大多数律师的工作。从咨询、起草、分析到出庭,所有这些都可以由AI完成。这将引发一系列伦理和法律问题,例如谁应该对AI的错误负责,以及如何确保AI的决策是公平和透明的。

THE END
1.法律大模型及案例介绍法律大模型是指专门针对法律领域的人工智能模型,它在通用大模型的基础上,使用高质量的法律数据进行微调,以提高模型在法律问答、文本生成、案例分析等任务上的专业性和准确性。以下是关于法律大模型的详细介绍: 一、定义与特点 法律大模型是一种基于深度学习技术的人工智能模型,它利用海量的法律文本数据进行预训练和微调https://blog.csdn.net/2402_84466582/article/details/140094041
2.智爱法律大模型可针对每个用户的特点培养专属法律大模型 律师工作的降本增效 律师可直接使用AI功能模块提高工作效率 执业领域的加强补足 为客户提供AI法律服务产品,提升竞争力 知识技巧的留存沉淀 使用中不断进化,更加符合律师使用习惯 为什么选择智慧律师? 真正使用大模型的AI技术 https://www.zhiexa.com/home/
3.chatlaw法律大模型官网,智法网页版入口,下载,基于中文法律条文ChatLaw 是一个基于各种中文法律条文、实际案例、判决条文所训练出来的法律大模型,可借助 AI,实现法律合同撰写、案例介绍、条款讲解、司法问题咨询等场景。ChatLaw(智法)模型由北大-兔展AIGC联合实验室和北京大学信息工程学院袁粒课题组联合发布。基于超过2亿的判例文书原始文本,以及340万条法律法规和地方政策,构建了大https://biemoyu.com/sites/chatlaw.html
4.ChatLaw法律大模型中文法律大模型ChatLaw是一个基于深度学习和自然语言处理技术的中文法律大模型,模型支持文件、语音输出,同时支持法律文书写作、法律建议、法律援助推荐。ChatLaw 法律大模型通过分析大量的法律新闻、法条、判决文书等数据来提供法律服务。该模型能够帮助用户撰写法律合同、解释法律条款、提供司法问题咨询,并支持法律文书的撰写和法律建议。https://www.bgrdh.com/sites/24904.html
5.北大兔展联合实验室发布中文法律大模型ChatLaw,为大众提供普惠最近,由北京大学信息工程学院袁粒课题组 与 北大-兔展AIGC联合实验室 联合发布的中文法律大模型产品ChatLaw,就为普通人提供了获取普惠法律服务的途径。 用户通过简单对话,即可获得较为专业的法律建议。 甚至提供专业的法律文书。 与此同时,它在网页上即可使用,没有次数限制,还能读取文件和音频,提供专业法律文书、推荐https://m.cyzone.cn/article/731575.html
6.「翊天」法律大模型极客公园在软件生态产品论坛上,作为国内法律大模型领域的领军企业,图灵微雀云重磅推出翊天律师智能助手——全国首个围绕律师诉讼业务全流程的 AI 智能助手,旨在为法律服务行业带来前所未有的创新与变革。 科技速递 七日热门 1 智谱放大招:大模型从「Chat」走向「Act」 2 售价百万鸿蒙尊界 48 小时预订 2108 台;快手停用https://www.geekpark.net/tags/%E3%80%8C%E7%BF%8A%E5%A4%A9%E3%80%8D%E6%B3%95%E5%BE%8B%E5%A4%A7%E6%A8%A1%E5%9E%8B
7.探索国内法律大模型的先行者:得理科技的AI赋能之旅1. 法律咨询:得理法律大模型可以处理高频的法律咨询业务,包括公司常年顾问服务和普通民众的法律纠纷咨询。 2. 法律文书写作:得理法律大模型能够撰写各种法律文书,如合同、起诉状、答辩状和法律分析意见。 3. 案例分析:得理法律大模型可以进行案情分析,帮助预测法官的判决,了解法律规定和研究过去的案例。 https://www.iyiou.com/news/202406061068815
8.ChatLawChatLaw是由北京大学团队开发的开源法律大语言模型(LLM),它通过结合法律领域特定的数据集和外部知识库,旨在提高法律问题处理的准确性和效率。该模型利用先进的自然语言处理技术,能够理解和生成法律相关的咨询和解答,同时减少法律数据筛选中的模型幻觉问题。ChatLaw的设计考虑了法律语言的复杂性和法律知识更新的快速性,力图https://ai-bot.cn/sites/11444.html
9.讯飞星火法律大模型全国产化自主可控讯飞星火法律大模型,探索智慧法治新模式,共筑司法新质生产力 产品介绍 应用 模型 法律咨询 构建涵盖法律意见咨询、策略指引、材料编写等综合服务应用,提供全方位法律支持。 法律检索 基于法律情境精准检索相关法规及典型案例,提供法律观点及研究指引,助力法律决策。 https://www.xinghuolegal.com/
10.中国首个应用级法律大模型!通过国家网信办备案审查中国首个应用级法律大模型!通过国家网信办备案审查 近日,北京大学法律人工智能实验室自主研发的“元法大模型”成功通过国家网信办的生成式人工智能(大语言模型)上线备案审查,成为国内法律垂直领域首个获得国家主管部门备案的AI大模型。 “元法大模型”采用了首创的规则推理引擎技术,并经历了七百亿级参数的预训练。该https://essentialslink.cn/doc/docView?id=4848
11.对话丨ChatLaw团队袁粒:做普通人也能用的法律大模型雷峰网让ChatLaw 变成最专业的法律大模型 AI科技评论:专业数据对于大模型的垂直领域场景理解至关重要,ChatLaw 在数据收集的角度,做了哪些努力? 袁粒:法律领域相较其他比较特殊——很多最高质量的数据,都是公开数据。这其中就包括法律法规、判例文书、司法解释等等。我们的数据处理,主要就是基于这些公开的数据。 https://www.leiphone.com/category/aijuejinzhi/qqggTwkYCtxfuriP.html