网聚法言第十期:人工智能介质下审判路径范式构建透析——法律知识图谱的模型构建澎湃号·政务澎湃新闻

人工智能介质下审判路径范式构建透析

——法律知识图谱的模型构建

作者

叶胜男杭州互联网法院互联网审判二庭副庭长

李波浙江省高级人民法院研究室主任科员

互联网法院全程在线、全程留痕的特性给人工智能审判带来了更大契机和广阔的天地。法律实务界将人工智能审判视为一个“聪明但不独立的助手”,即“以海量数据为基础,以类型化案件为突破口,通过提炼裁判规则、研发最优算法、归纳既有经验,以实现在类型化案件中裁判规则、司法经验,完成有限智能化。”[黄京平:《刑事司法人工智能的负面清单》,载《探索与争鸣》杂志,2017年第10期,第86页。]

(一)信息可溯源

(二)链路可互通

(三)机器可抓取

(四)图谱可汇制

构建知识图谱的主要目的是获取大量的、让计算机可读的知识,包括知识获取,即从非结构化、半结构化以及结构化数据中获取知识;数据融合,即将不同数据获取的知识进行融合构建数据之间的关联;知识计算及应用,即基于知识图谱计算功能以及基于知识图谱的应用。

大量的法律专业人才和技术人员通过构建法律知识图谱,来实现技术和法律的融合。目前华宇元典法律知识图谱内容的提炼过程大致经历了这几个步骤:小样本研究,监督学习,人工标记,人工检索,强化学习,交叉验证,原型开发,模型测试,部署试用,模型调整。

法律知识图谱属于垂直行业领域的知识图谱,从图示的直观形式来看,它是众多法律要素组成的知识库。法律知识图谱是机器进行法律知识推理的基础,它将法律规定、法律文书、证据材料及其他法律资料中的法律知识点以一定的法律逻辑连接在一起形成概念框架,它的概念框架上的每个知识实体或概念又分别与法律法规、司法经验、案例、证据材料等相应挂接,从而建立起法律概念、法律法规、事实、证据之间的动态关联关系。不同于英美法系的判例法,在中国是成文法的背景下,知识图谱将法条和司法解释用更加有逻辑的语言表达出来,且比文字更加明确,更加有逻辑。知识图谱优势在于可以根据法条、司法解释的更新进行迭代,因此可以构建出知识图谱为主,大数据为辅助,类案为辅助的人工智能审判框架。

(五)黑盒子的悖论

人工智能审判的“黑箱”可以被解读,AI像人一样具有复杂学习的能力,可以从许多看似不相干的事物中产生一个认知。神经网络算法可以描述不相干的事物,其采用网状的非线性函数,在不相干的元素中建立一个假设的逻辑关系,然后通过海量的数据来检验这种假设的正确性,淘汰正确度低的假设,保留正确度高的假设,如果通过简单的线性逻辑去反向理解它产生结论的原因,就相当困难。但是法律知识图谱并不是一个黑盒子,神经网络算法突破了传统的线性思维逻辑,图像领域的许多标准任务上已经有一定的可解释性。实践操作中,人工智能审判中每个环节法官都可以参与,比如证据认定环节、事实认定环节等等,法官知道自动生成裁判文书的推理过程,如图2所示,人工智能审判的整个框架都在审理案件逻辑,最后出裁判结果。

二、阻碍:人工智能审判的局限性——从技术的本质特征角度

人工智能审判有没有技术禁区?“技术边界”或称“能力禁区”,是指司法人工智能能所“不能”做的事情。有人指出,司法人工智能审判存在“匮乏且低质的法律数据、隐秘且低效的算法、薄弱的人才”等三方面的现实困境,难以深入全面开展。[左卫民:《关于法律人工智能在中国运用前景的若干思考》,载《清华法学》2018年第2期,第114页至120页。]

(一)法律知识图谱没有衍生性

但是机器不是万能的,法律知识图谱没有衍生性,目前的人工智能审判都是通过案由进行分类,一种案由的法律知识图谱只适用于特定案件,没有衍生学习能力。法律专业壁垒在法律知识图谱的构建中,乃至在法律大数据领域,都是难以逾越的。法官具有全面学习的能力,法官是全能的,但是机器人无法具备,只有人类输入什么,机器人才会接收什么。

(二)人工智能无情感

有人认为,人工智能缺乏人类智能“心性、灵性和智性”混合体中的“灵性”成分,根本无法与人类法官相提并论。法律事务从业者认为“至少在某些方面”人工智能与人类法官注定存在差距,由于“人工智能审判的局限性、法官审判工作的逻辑性、系统性、法官的职业性和经验性”等三方面的原因,导致司法人工智能无法取代法官。[潘庸鲁:《人工智能介入司法领域的价值与定位》,载《探索与争鸣》,2017年第10期,第104页至105页。]

必须承认的是,像案情整理和法律检索甚至是IPO这种标准化程度较高的工作,都能由机器人承担,关键点在于复杂案件中的事实认定和法律适用的问题。“法律的生命不在于逻辑,而在于经验。”潘德克顿法学的法律体系发展出一套“概念法学”,主张用逻辑的方法解释实在法,法官就是对法律进行逻辑操作的机器,不允许司法对立法进行解释和续造,但最终失败。

机器是没有感情的,这使得机器人虽然不会被情绪所影响,能够做到绝对地无所偏私,但是也不会使用情绪,不会理解情感,也不会理解何为正义感。即使机器人有学习能力,有大数据运算能力,但是也无法像法官在面对一个主动认罪的被告人时做出的思考:“是不是可以考虑减少一个月,酌定从轻处罚”。特别在民商事案件中,很多案件的服判息诉都是因为法官在审判过程中体现的公信力、人文关怀和人格魅力,而机器无法体会。因此法官需要不断学习更新,需要对社会和人生具有深刻理解,充满创造性、富有正义感。

(三)“标准化”冲突

人工智能审判面临的挑战之一在于当前目前人工智能审判的“标准化”的要求与当前人类司法的“可靠性、相对性、适度性、独立性、可控性”存在间接的潜在冲突。有人认为,无论是ODR(onlinedisputeresolution,ODR)还是正式的判决系统,通过使用多渠道的更好且易用的信息,并去除诉讼当事人的外表信息(如种族、性别、体重等),都能够有效降低判决过程中的主观偏见性。也有人认为,“具有相对性的民商法司法裁判都具有明确的上位法依据,主要体现为正式制度适用的差异,因此作为判定司法责任基准的裁判尺度,是以相对性为基本特征的。”[黄京平:《刑事司法人工智能的负面清单》,载《探索与争鸣》杂志,2017年第10期第92页。]人工智能审判提供的是标准化审判,而法官由于长期、良好的司法专业训练对审判工作没有完全统一的标准尺度,特别对于疑难复杂案件,人工智能审判对于判决书说理论证等需要法官自由发挥的部分无法胜任。

(四)人工神经网络适用类型的局限性

人工神经网络由输入层、多隐层、输出层构成,每一层都有若干个神经元,神经元之间有连接权重,是模仿神经网络行为特征并进行分布式并行信息处理的算法模型。由众多神经元的连接权值而成的神经网络系统,具有深度学习的能力。[【美】StartJ.Russell、PeterNorvig:《人工智能—一种现代的方法》,殷建平、祝恩、刘越、陈跃新、王挺译,清华大学出版社2013年版,第254页。]人工神经网络对没有严格定律隐含层神经元数量的选取,其可以通过经验、训练来获取,但是对层级化结构、要件化、标准化要求较高,故而限制了适用的案件类型。遵循“确定请求权基础-解构要件-证明要件-事实认定-法律适用”识别路径的要件事实型民事裁判案件内在契合了人工神经网络的特征,实体法规范、构成要件以及要件事实构成逻辑严密的网络,能够使得机器从案件事实中区分出基本层次,最适合通过汇制法律知识图谱来实现智审。

三、应用:人工智能审判的模型探究——要件事实型民事裁判论

要件事实型民事裁判论是指,明确要件事实法律性质后,依据民事实体法规范结构、民事诉讼审理机构展开的民事裁判方法。[许可:《民事审判方法:要件事实引论》,法律出版社,2009年版,第2页。]其裁判逻辑为:“识别请求权基础规范—请求权基础规范的要件解构—争点整理—证明责任分配—争议事实认定—涵摄得出裁判结论”,综合实体与程序,最终得出结论。人工智能易于模拟具有确定的审理对象、明晰的法律规则、经审理后确定的案件事实以及规范的程序规则,这些内容都是要件事实型民事裁判论的核心要义,因此要件事实型民事裁判论从性质、结构、方法上,都是人工智能知识积累的较好选择。

序列标注方法上,学界提出了LSTM-CRF模型做序列标注,在LSTM层后接入CRF层来做句子级别的标签预测,使得标注过程不再是对各个token独立分类。在英文NER任务中先使用LSTM来为每个单词由字母构造并拼接到词向量后再输入到LSTM中,以捕捉单词的前后缀等字母形态特征。

(一)模型总体路径分层标注的解读

首先,根据原告诉讼请求以及事实理由明确案由、诉讼标的,以确定案件审理的请求权基础规范,再将请求权基础规范解构为若干要件,对请求权基础解构下的第一层次的要件事实进行标注。

其次,标注要件事实的证明与认定过程,审理过程中,被告对于原告诉请会进行答辩,原告要对其所主张的事实承担证明责任,只有完成高度盖然性的要求,原告的事实理由才能法官认定。在此过程中,法律专家需要对证明责任分配和证明标准予以标注,提供给机器学习。被告针对原告诉讼会提出事实抗辩或者间接否认的积极防御,就需要对事实抗辩与间接否认的证明责任分配及证明标准的节点予以标注。

再次,标注证明路径。证明路径可以分为两种:一种路径是直接证明,当事人通过举示证据而直接证明事实,另一种路径是间接证明,当事人通过间接证据来证明间接事实,法官依照经验法则推定主要事实。法官专家可以按照此二维路径对个案证明方式予以标注,并形成司法大数据,机器就可以依照证明方式的知识点进行深度学习。

最后,标注请求权基础规范能否适用的法律效果。请求权基础规范的各个要件事实均被认定为真的情况下,请求权基础规范能够得以适用。法律专家可以对各要件事实认定情况、裁判结果加以予以标注。

综上,通过要素解构要件事实型民事裁判论,可以实现对实体法规范、各要件事实、事实主张与抗辩、抗辩与间接否认、证明责任、直接证明与间接证明、裁判结果等各要素形成分层次、分阶段标注,这些要素也可以提供给机器规范化、标准化、体系化的知识积累。需要注意的是,机器在此过程中需要对起诉书、证据、庭审笔录等字、词、语句、篇章学习、理解、记忆,进行表征学习,文本表征里面分为三个部分:词级表征、句级表征、篇章级表征,可使用模型有词级表征模型:Word2Vec,Glove,Bert;句级表征:CNN,RNN,Bi-LSTM,GRU;篇章级表征:RNN-Attention,GRU-Atten。

(二)案例演示——以信息网络传播权类纠纷案件为例

信息网络传播权纠纷是典型的要件事实型民事裁判类纠纷,法官可以根据请求权基础规范的构成要件,将待证事实解构为若干要件事实。绘制法律知识图谱的过程中,法律专家根据要件事实论完成层级解构和标注以后,机器可以有效学习。在信息网络传播权纠纷中,包括以《中华人民共和国著作权法》第三条、第九条、第十条、第十一条、第二十五条、第四十七条、第四十八条,《中华人民共和国侵权责任法》第九条为请求权基础的侵权损害赔偿之诉。

最后,对裁判结果进行标注。信息网络传播权的侵权损害赔偿之诉中,驳回原告全部诉讼请求、驳回原告其余诉讼请求,判令被告赔偿原告等裁判结果的事实依据、法律依据进行要素解构和标注。特别是请求权基础、要件事实、证明过程、证明路径等事实成立或者部分成立导致不同的裁判结果进行标注,供机器深度学习,最终相应的法律知识点作为分支结构,形成一颗决策树。目前一颗决策树的法律知识图谱被验证不足,法律图谱应当是立体形态的,且只是引擎的一个环节,多种图谱通过逻辑符改造搭建成引擎,最终绘制成立体决策树。

本文内容刊登于《人民司法》2019年第31期

原标题:《【网聚法言】第十期:人工智能介质下审判路径范式构建透析——法律知识图谱的模型构建》

THE END
1.法律的悖论这都是因为法律中存在着似非而是的悖论。法律中充满着悖论,有些是真悖论,有些是假悖论。罗翔老师在书中通过14个经典案件,辨析了法律与案件中的盲区,帮助我们看清法治的核心。探讨和思考法律中的悖论,能够锻炼我们的思维,走出偏见与独断,接受多元与包容。https://www.dglib.cn/dglib/sts/202402/611d221f4eba4d199e5602ccba430957.shtml
2.法律的悖论(豆瓣)法律的站位总是高于更多人的认知 最早知道罗翔老师,是看他在短视频里讲张三的案例,每一个看似普通的案例,经过罗老师的解读,总能让人重新打开视角。 当然有时候罗老师说的结论,也不一定都能得到观众的认同,因此,有时他也会遭到一些网友的语言攻击。 问题出在哪呢?看罗翔老师写的《法律的悖论》就清楚了 (展开https://book.douban.com/isbn/9787222221833/
3.045:多元——《法律的悖论》这是罗翔的普法作品,书中通过14个经典案例,让我们体会相互矛盾且合理的立场,透过这些似是而非的“悖论”,帮助我们看清法治的核心、走出法律的盲区、接受多元与包容。 一、法律:法不容情,又法中有情 入罪问题讲法律,法不容情;出罪问题讲道德,法中有情。 https://zhuanlan.zhihu.com/p/679433260
4.《法律的悖论》深度解析近期我读了罗翔老师的《法律的悖论》,这是一本偏理论性的书籍,让我对法律有了更深入的思考。书中探讨了法律中的悖论,这不仅仅是对法律条文的解读,更是对法律思维方式的锻炼。通过思考这些悖论,我们可以走出偏见,接受多元与包容。?♂?在真实的法律案件中,法律的悖论往往直接影响个人的自由和生命权https://mbd.baidu.com/newspage/data/dtlandingsuper?nid=dt_4494684929519451785
5.费米悖论与收益递减,超级人工智能与人类社会将会怎样相互作用为了确保超级AI的发展符合人类社会的长远利益,需要从法律、政策和社会规范等多个层面进行努力。首先,需要制定全面的法律框架来规范AI的发展和应用。 在探索宇宙生命的奥秘时,我们不禁会问:在这浩瀚的宇宙中,为什么我们还没有遇到其他文明的迹象?这个问题被称为费米悖论。而在人工智能领域,随着技术的飞速发展,超级AI—https://www.51cto.com/article/785680.html
6.国家关系范文12篇(全文)但是,气象环境、气象资源的享有始终与一定的地理和空间相联系,人们在社会生活中经常会出现争雨水资源、争光照资源、争有利气象条件空间、争空中云水资源、或因人为原因造成局部气象环境恶化等而引发各种纠纷,调整这些社会关系需要国家制定相关法律。随着社会的进步和发展,人们涉及气象资源、环境的社会活动大量增加,由此引起https://www.99xueshu.com/w/ikeyjsu7hhwo.html
7.新疆平安网基本目标是构建系统的法律体系,改革审判体制,完善全国布局,最终形成具有中国特色、互联网时代特色、在地位上与传统法院并行比肩的、科学完善的互联网法院体制和审判体系,实现互联网法院高质量发展,推进司法治理体系和治理能力现代化。 1.制定《互联网民事诉讼法》。现行《民事诉讼法》是针对物理空间发生的传统诉讼而制定的http://www.xjpeace.cn/content/2022-08/17/content_39629.html
8.邵六益:数据人民性的政法解读法制与社会发展202405法律私法1.中华优秀传统法律文化的传承发展逻辑 侯学宾(5) 【全面依法治国研究】 2.论“五四宪法”作为治国安邦的总章程 韩大元(22) 3.现行宪法对“五四宪法”的传承与发展 任喜荣(37) 4.刑事诉讼的中国式现代化:道路与图景 谢进杰(52) 【法学新概念】 5.数据人民性的政法解读 https://www.163.com/dy/article/JBLN0VRT0530W1MT.html
9.Contents/premium.mdatmaster·Newslab2020/Contents·GitHub权力的悖论:最强大的也最脆弱,最无力的也最倔强; “塔西佗陷阱”是中国人创造的概念。 648 记者的情绪劳动与职业倦怠 2023/1/31 什么是“情绪劳动”? 612 俄乌战争迄今最深度报道 2022/9/1 美国视角:早已获取情报,但难以说服盟友; 俄罗斯视角:为何做出错误的、愚蠢的判断; 乌克兰视角:抵抗的奇迹是如何发生https://github.com/Newslab2020/Contents/blob/master/premium.md
10.蔡昉:深度解读人口负增长的经济影响索洛观察到计算机的普遍应用没有带来生产率的提高时提出的“索洛悖论”仍然有效。人口进入负增长时代,生产率并不可能自然而然提高,必须用新的发展方式来替代二是国家的教育支出是有保障的。中国法律规定,GDP的4%要用于公共教育支出,中国未来GDP的潜在增速有4.8%,公共教育支出实际增速在4%以上是有保障的。 http://www.china-cer.com.cn/zhonghong/2023042724286.html
11.北京瀛和(沈阳)律师事务所我所合伙人律师刘国照受邀分享了《法律的悖论》一书,刘律师以“道德规范所认可或鼓励的行为绝非犯罪”、“不做傲慢的人”为主要分享观点,通过列举书中的典型案例,向在场听众传达了作为法律人应当具备的法治素养。并给出了自己读书后的所得:存在不一定合理,存在一定有原因。作为法律人,唯有理解包容,才能超越人性,才能http://yingshenlawyer.com/index.php?m=cn&c=Ibase&a=view&id=445
12.老年人算法歧视的法治应对因此, 应从法治的角度进行顶层设计, 对破解老年人算法歧视与积极应对人口老龄化国家战略之间存在的现实矛盾与发展悖论问题予以合理化规制, 即用分层理论完善老年人法律制度以纠正法律本质主义年龄歧视下的制度性缺陷, 解构数字孪生法律制度嵌套规制老年人歧视的"算法黑箱", 赋予老年人算法自决权以积极推动"积极应对人口http://qks.cqu.edu.cn/html/cqdxskcn/2024/3/20240318.htm
13.数治长文万字解读数据要素的20大特性及其影响–数治网影响:阿罗信息悖论对数据定价和交易具有至关重要的影响。一是在数据定价方面,如果卖方不披露数据的信息,买方无法知道数据的真实价值,无法达成双方共同接受的市场公允价。但是,一旦卖方披露数据的信息,或者只披露了部分关键信息,买方就可能以更低成本从其他渠道获取功能相同或相近的可替代数据,卖方持有的数据价值就会贬值https://dtzed.com/dtzed.com/talks/2023/10/8147/
14.孔孟之道与中国文化(精选6篇)但只有最终能够与员工共同构建适合市场发展要求与企业发展特点的优秀企业文化的老板才能实现企业的可持续发展。我国民营快递公司老板只有善于将自己的优秀思想传授到企业文化建设中,才能有利于实现老板文化与企业文化的交融,成为处理老板文化与企业文化悖论的有效办法。https://www.360wenmi.com/f/filej3xc6rg3.html
15.c端运营是什么意思(解读高阶运营和初阶运营有哪些差别)3. 洞察的深度 抓核心问题的能力,到底是什么样的段位,决定了是不是高级运营。一个高级运营,应该具备很强的增长引擎的识别能力,不需要既做抖音、又做微信公号、还要做淘宝才能够实现业务的增长,而是在复杂的业务环境里,在对这个业务的梳理过程中,快速识别出来这个业务的关键点和关键资源。通过聚焦于一个点,整合资https://www.niaogebiji.com/article-160530-1.html
16.RSAC2022深度解读十大热点议题,把脉产业变革趋势在“隐私和区块链悖论”议题中,专家比较了区块链的优点与劣势,提出了区块链用于隐私保护以及GDPR合规的四个注意事项:(1)一项技术和一项法规-数字世界中的在“面对/关闭:使用生物识别技术进行身份验证的战斗”议题中,来自思科的专家提出了DeepFake等技术对人脸识别和身份认证带来的技术风险,以及相应的法律风险,并提出https://www.qianxin.com/news/detail?news_id=5227