“大数据开启了一次重大的时代转型。就像望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉,而更多的改变正蓄势待发”。2013年,英国学者维克托对大数据作出了如此预言。近几年,大数据技术发展迅速,为社会带来了巨大变革。伴随着大数据技术在社会各方面的深入推广使用,司法上也不可避免地要遇到各类承载着机器人算法和人工智能技术的大数据资料。当基于大数据技术而获得的结论造成了事实争议,或者大数据技术运用本身形成争议时,大数据技术便须作为法院审理的核心之一,在法庭上接受质证与调查。因此在证据上,大数据证据不可避免将成为法院需要面对的重要证据之一。法院应如何面对大数据特性带来的证明难题,在大数据的冲击下维持确保司法公正的基本程序原则,是本文要讨论的问题。
讨论大数据证据在法院审理中的具体应用,须将证据的使用情景具现化,在详实的语境范围内作出实际探讨。不同的使用情景中自会形成不同的证据问题。因此,有必要首先归纳出目前大数据技术的应用类型,明确不同类型可能产生的不同证据情况。在现阶段,大数据在各方面均已有了十分广泛深入的应用。整体而言,大数据应用根据原理差异,可以分为三种类型,分别为大数据预测类应用、大数据识别类应用、以及大数据分析类应用。这三种应用在刑事及民事诉讼中,会形成具备不同证明功能的大数据证据,从而产生不同的证据问题。
另一方面,尽管这类大数据预测依靠的并不全是(甚至大多数都不是)大数据被运用者本人相应行为的信息数据,其对大数据被运用者的信息监控和提取却是海量的。并且,大数据运用者会通过信息协同效应,将原本没有意义的信息碎片整合起来,形成严重危机个体隐私权的完整情报。例如利用算法,将监控摄像头下每个人一个月内的行径踪迹全部整合起来,从中发现疑点并作出预警,公安机关再根据这些疑点着重调查可疑对象,从中发现犯罪线索,实现犯罪预防。此时大数据算法实际已经将原本零碎的监控内容整合成了每个人完整的生活轨迹,其阻止犯罪的价值与其侵犯个体权益的代价相权衡,使用这类大数据预测的正当性值得考究。因此,对于这类大数据证据,证据的合法性必然也会发生争议,是否应当基于非法证据排除规则予以排除,是值得考虑的问题。
大数据识别类应用是指,通过对图像识别、词汇识别、语音识别等算法,对存在的具有特定特征的信息进行识别筛选,从而对算法监控的特定行为对象进行识别、预警或消除。大数据识别类应用的一般运用即为人脸识别、语音转笔录、听歌识曲等应用,更为复杂的则为以上述识别为基础,进行进一步的判断操作类应用。例如公共场所对类似炸弹等危险物品的识别排除,或对具有特定特征的人进行潜在危险分子的识别预警;网络平台对带有敏感词的语句和视频的识别和自动删除;网络平台对可能侵权的视频和音乐的识别和删除。
通过上述两种大数据识别类应用的损害情形可看出,对于此类问题,大数据识别与损害之间的因果关系将成为法院审理的一大焦点。为解决此问题,则大数据算法的合理性必然会成为争论的对象。大数据方当事人会以大数据算法合理为由,将被运用者的损害正当化,以免除自己的过错赔偿责任。而另一方面,被害者也会根据大数据的算法逻辑来证成自己向大数据一方当事人的损害赔偿请求权。
大数据分析类应用与大数据预测类应用和识别类应用存在一定的机理差异。无论是大数据预测类应用还是识别类应用,其应用设计均有较为明确、较为唯一、且可公开的指向目标。对于大数据预测类应用而言,其目的在于预测筛选未来可能发生的特定行为,这种行为本身是明确且可公开的。例如,公安机关针对机场筛选可能涉及恐怖袭击的行为;金融程序针对客户筛选可能危机金融稳定的行为。此类筛选均有明确且可合理推导得出的积极指向,大数据设计者也没有就筛选对象的隐瞒理由。
二、大数据证据运用的价值权衡
如上文所述,不同类型的大数据应用均有其大数据证据的关联性和合法性问题,将会影响大数据证据的可采纳性,而大数据证据所要证明的往往是大数据一方行为的合理性和正当性,如果大数据证据不可被采纳,则大数据一方剥夺受害者权益、造成其损害的行为将失去合理依据,从而将在裁判中获得不利的结果。
由此可见,大数据证据能否被采纳,会成为一项证明关键。就结果而言,通过大数据技术而产生的证据显然具有直接关联性,且能够实现大数据运用者所欲追求的特定价值。然而就过程而言,大数据算法所依据的数据及数据获取手段却可能存在不当。尤其如果进行长远的价值考量,大数据证据的获取手段如果被允许,其未来可能带来怎样的影响,是否会违反司法的价值理念,是法院需要慎重考虑的问题。这其中,大数据预测类应用下的证据关联性和合法性问题尤为突出,因为大数据识别类和分析类应用的影响力及于当下而非未来,其主要依据的数据也基本围绕大数据被运用对象本身。当此类的大数据算法存在合理性问题时,其会成为大数据被运用者主张自身损害的事实依据,更多属于法院需要调查的事实问题,而非证据问题。与之相比,大数据预测类应用,尤其是刑事诉讼中,大数据预测类应用作为锁定犯罪嫌疑人的主要线索之一时,其证据的关联性合法性将直接影响到被告的定罪问题,更能成为证据焦点。
由于大数据证据的结果与其获得过程的正当性和与所证事实之间的关联性存在着脱节,因此,对大数据证据是否具备关联性及合法性的判断无法回避对司法影响的价值性判断。此时,应权衡大数据证据被采纳之后所获得的价值,与其所侵害的权益相比,谁更为根本更为重要。在民事诉讼中,应考虑大数据证据被采纳之后所实现的司法救济,与大数据证据的形成过程可能给平等、意思自治、契约合意等私法基本理念带来的损害相比,哪项更为关键。例如,当大数据证据的采纳只能给强势群体带来纯粹的经济价值,而其代价则是弱势群体在私法社会中的意思自由时,该大数据证据的采纳即应予以慎重考虑。反之,若大数据证据对意思自治的侵犯是为了维护更多个体的权益,则该证据即可以考虑被采纳。在刑事诉讼中,要充分考虑大数据证据的运用,是否会给公权机关带来更容易侵蚀公民权利的空间。尤其要考虑的是,当大数据证据被允许自由运用,从而给公权机关传递出可推广大数据技术适用的信号时,是否会产生公权滥用的潜在危险。
无论是上述何种大数据应用类型,均会存在需要通过算法公开以论证大数据结论合理性的情况。若大数据算法逻辑不合理,则大数据运用方当事人必然需要承担相应的损害赔偿责任。而如上文所述,大数据分析类应用除了自身的算法逻辑之外,其算法设计的动机逻辑也会影响到大数据应用结论的合理性,会比其他两类大数据应用多一层对算法设计逻辑的公开要求,需要设计者说明对大数据分析的预期设计。
无论是民事诉讼还是刑事诉讼,均需要考虑诉讼对抗双方的实质平等问题,避免两者的实力差形成的裁判不公。在民事诉讼中,法院维护实质平等的表现主要在于对基本权利遭受侵害的被害人的侧重关怀,以及在一方当事人为企业等强势主体,另一方当事人为普通个体时对普通个体的侧重保护。在刑事诉讼中,法院维护实质平等的表现主要在于对公权机关强力的程序合法规制,以及对被告人的无罪推定保护。
值得一提的是,上述证明责任的分配,并不影响承担证明责任的当事人基于自己举证的困难而向法院申请文书提出义务,或向法院申请依职权调查证据。对证明责任的分配,应避免仅因证据偏在而实行常规证明责任的频繁转移。作为实体法明文规定下来的证明责任,其分配应考量更宏观的社会调整以及同类型案件的整体共性,而证据偏在这种更加个案、更为具体的问题则可通过程序法的文书提出义务制度解决。换言之,对于大数据运用者而言,即使其不承担证明责任,也可能基于文书提出义务或法院的要求而产生必须提交大数据证据的举证负担,否则即可能需要承担相应的不利后果。
三、大数据证据运用的具体规则
根据上文分析的价值权衡,本文认为,大数据证据的司法运用,应当基于民事诉讼和刑事诉讼各自不同的情况,遵循以下具体的证据规则。
如上文所述,大数据预测类应用与其他两种应用不同,需要采纳更广泛多元的数据来预判尚未发生的行为对象,对这类证据的司法采用将对司法理念产生更为深远的影响,因此要慎重考虑。刑事诉讼和民事诉讼的司法理念并不相同,因此应分开分析。就民事诉讼而言,其司法理念优先保护自由公平的交易社会,尽可能减少对双方当事人的权利约束。因此,只要大数据预测类应用没有严重侵犯一方当事人的意思自由,使其彻底失去公平交易的机会,则可予以允许。然而对于刑事诉讼而言,公权机关的特殊性使其对大数据预测类的应用具有更深远的侵犯公民权利的潜在危险,因此应予以更为审慎的规制。由于大数据预测类应用始终要以大量个体零碎化信息为依据,始终存有隐私侵害、偏见统计等问题,因此应谨慎适用。通过大数据预测来获取线索的侦查手段,应局限在重大恶性案件,并在其他常规侦查手段穷尽的情况下才可以使用,否则即应将这类证据视为缺乏合法性而予以排除。
最重要的是,应确保这类大数据预测只是一种问题的解决手段,而非发现问题的平台,以防止这类大数据的滥用。例如,对于贩毒案件,大数据预测类应用应当是在发现贩毒问题之后,为了能够锁定犯罪嫌疑人所在地点,在穷尽其他侦查手段后,通过大数据预测来判断其可能出现的地方。大数据预测类应用不能直接作为一种犯罪预测,在贩毒案件被发现之前启动预警,引导侦查机关去发现案件以及犯罪嫌疑人。如果采用后一种应用模式,大数据预测类应用就会长期启动,所有人都会长期处于过度的监控之下,且所有人的信息在碎片整合的情况下能够随时均被大数据运用者完全掌握,而不仅仅是在亟须这类信息的时候才被掌握。这样的大数据预测类应用是超过其需求范围的滥用,应当予以禁止。
算法解释应与相应的证据相配合,确保大数据运用方提供的解释为真。例如,外卖平台公司为证明自己没有利用大数据分析模型来过度剥削骑手劳力,应对自己的外卖配送算法逻辑和算法设计逻辑予以解释,并同时提交外卖配送程序开发时的记录文件和载有讨论运营成本利益的公司文件,以对相应解释进行佐证。在必要的情况下,当事人及法院可以委托第三方中立机构对大数据算法进行专业鉴定,进一步确认大数据运用方的算法解释是否真实。在民事诉讼中,当事人的鉴定申请可以由法院根据案件情况决定是否准许。然而在刑事诉讼中,考虑到公诉机关与被告人之间的关系,以及两者与法院之间的距离和被告人对司法公信力的主观感受,对于当事人委托第三方中立机构来鉴定大数据算法的申请,刑事法庭应当以准许为基本原则,只在申请明显不合理的情况下予以驳回。
算法解释义务必须附有违反该义务时的严苛制裁,才能确保义务人的履行。大数据运用者的算法解释义务可以比照文书提出义务,违反义务时排除该证据,或者法院直接认定对方当事人所主张的事实为真,以督促大数据运用方积极履行算法解释义务。
往期精彩回顾
姜兴智|赋能型法治:破解营销号问题的体系性框架
张祖增邸卫佳|ChatGPT模型在数字图书馆建设中的嵌入:风险挑战与法律防范
仇欣欣|新型互联网不正当竞争司法审查范式构建
李超李旭颖|算法司法的扩张:基本框架、制度逻辑与权力调适
黄春晓胡蓉|算法(智能)时代的司法筹谋——基于革新命题视野下的思维导向与图景架构
唐国峰黄俊杰|司法大数据视野下执行“衍生案件”的治理进路