一、问题的提出:大数据时代的证据维度
二、大数据证据在刑事司法中的表现形态与作用方式
(一)大数据证据在刑事司法中的表现形态
在数据时代,人们的犯罪行为会留存下越来越多的数据痕迹,这些构成了恢复案件真实的重要物质基础。在当前刑事案件中,大数据证据往往被(或可能)用于侦查破案线索、反驳被告辩解、补强言词证据、印证性的间接证据等,在作用方式上主要包括基于海量数据的数据库比对和基于算法模型的大数据分析两种基本类型。
第四,作为印证性间接证据的大数据证据。除了作为辅助证据之外,大数据证据还可能以实质证据的身份用于证明案件的主要事实,但往往以间接证据的方式呈现。与直接证据不同,间接证据是需要通过分析推理才能证明案件事实的证据。在司法实务中比较常见的间接证据是实物证据和鉴定意见,它们往往需要与其他证据结合起来,一起证明待证事实。至于大数据证据,至今尚不存在通过大数据分析本身就能够证明犯罪事实的情况,即使假设如此,大量数据之间也必须通过算法模型和推理逻辑来建立联系,因此,将其定位为间接证据具有一定的合理性。例如,在高某开设赌场罪案中,法院的裁判文书指出,犯罪事实有受案登记表、立案决定书、户籍资料、到案经过、大数据情报工作,嫌疑人违法犯罪记录查询登记表、认罪认罚具结书,证人杨某、邵某、许某证言,被告人高某供述、辨认笔录、签认照片、现场勘验笔录等证据证实,足以认定被告人高某以营利为目的,结伙开设赌场聚众赌博,其行为已构成开设赌场罪。虽然裁判文书中记载的关于大数据证据用于证明的待证事实到底是哪一要件事实,但是,该表述似可以理解为一项独立的、对待证事实有证明价值的间接证据。
(二)大数据证据在刑事司法中的作用方式
三、大数据证据在刑事司法中的属性定位
作为一种新生事物,诉讼法和证据法上首先面临的问题就是通过大数据技术获取的证据材料能否作为证据使用。由于民事诉讼并不采行严格证明的方法,因此,学界一般认为,经由大数据比对或分析等获取的大数据证据可以作为证据使用。但是,刑事司法的多数事项(尤其是实体事实)的证明乃遵循严格证明法则,因此,大数据证据能否以及如何作为证据使用就显得更加复杂。
四、大数据证据的证据能力与证明力
(一)大数据证据的证据能力
(二)大数据证据的证明力评价
现代刑事诉讼针对证据评价普遍采行自由心证原则,即证据的证明力委诸于法官的自由判断,但这并不意味着法官可以恣意擅断、无所限制,相反,证明力评价还是要遵循论理法则和经验法则的内在约束。由于作为侦查破案线索、弹劾被告辩解和补强言词证据的大数据证据并不致力于实体案件事实的证明,这里主要讨论作为印证性间接证据的大数据证据。在事实证明上,间接证据蕴含着一定的悖论:虽然可靠性较高,但事实裁判者往往倾向于低估间接证据的证明力。然而,这一悖论并不适用于大数据证据。大数据证据可以作为间接证据使用,但由于其带有数据科学的光环,一旦被事实裁判者所接受并采纳为证据,其证明力就很容易被过度高估,从而强力影响甚至误导事实认定者。对此,不能不引起学界和裁判者重视。在评价大数据证据的证明力时,宜斟酌以下几个方面:
第一,信息连接点的选择。大数据分析本质上是一种针对一系列重要信息点的关联性分析,因此,首当其冲的乃是信息连接点的选择是否契合数据的特性以及待证事实的特定需要。在分析美国911事件的时候,安德森等证据法学者就指出,事件发生后人们反复宣称该事件本是能够预测和避免的,因为美国情报机构此前已收到一些信息,但他们却缺乏整理和分析这些信息的能力。他们没有能力去连接信息点或者无法从大量数据中鉴别出某些有意义的信息。传统侦查方法的局限也许恰恰是当前大数据分析的优势。然而,在大数据分析逐渐流行之后,需要值得注意的也正是这些大数据分析所建立的连接信息点的选择是否恰当。因此,事实认定者应重点审查个案中大数据应用的信息连接点(尤其是原始数据)本身的时新性、完整性和准确性。这些信息连接点的恰当合理性的选择,由于具有一定的专业性,裁判者需要借助于对控辩双方所提供鉴定人或专家辅助人等专业意见进行审查来实现。
第四,算法结论的稳健性。在统计模型的建构中,为了保证统计结果的可信度,一般都会使用多种方法进行稳健性检验。在对大数据证据的可信性进行审查判断时,也应当考虑稳健性检验问题。如果大数据分析结果能够得到多种方法的检验,则说明该大数据证据的信度更佳。相应地,在用于证明待证事实时的证明力也相对更强。
结语
其次,从价值理性的角度讲,不得不面对的是,以国家公权力为后盾的算法开发是否能足以保证算法模型的无歧视性,刑事司法机关所利用的大数据侦查方法是否符合正当程序的要求,以及由此获取的大数据证据是否能经受住严格证明法则的合法性检验。此外,在大数据时代,追诉机关在大数据获取和分析上占有绝对的和支配性的优势,不仅享有国家巨额资金去建设的各种数据库,同时也有权在必要时调取社会机构数据库中的数据,相反,辩护方则处于明显的劣势。可以说,控辩双方在数据比对、数据挖掘和数据处理能力等方面存在巨大的实力差距。这不可避免地会加剧我国以往侦查中心主义和控辩失衡情况。这同样是检视大数据证据时无法绕开之问,也呼唤着未来更具法律正当性的算法模型和控辩格局的到场。