论预测性司法

2024-08-02 作者:王禄生 来源:《中国社会科学》2024年第6期P80—P99

微信公众号

分享
链接已复制

摘  要:预测性司法是以系统论与运筹学为底色,以风险防控为导向的算法预测实践,遵循数据驱动的经验主义认识论。在安全治理需要、国家顶层推动以及政法科技创新的交叠影响下,我国预测性司法迅速发展,在引发刑事司法联结社会、治理社会、组织业务、决策理性等运行逻辑结构嬗变的同时,也与刑事司法价值形成内生冲突。基于良法善治的要求,应以“规制—认知—规范”总体合法性为切入点,基于比例原则确保预测性司法的合规部署和严格适用;按照司法价值敏感设计推动算法与数据二元治理,破除透明度与准确性悖论;围绕数字资本的均衡分布,以轻推为限度确保司法人员决策自主性、以关系伦理学强化诉讼参与人的有效参与。

关键词:司法;算法;预测性司法;自动化司法;精算司法

作者王禄生,东南大学法学院教授(南京211189)。

  从全球范围看,预测性算法以及承载它的统计模型与软件程序已经日益渗透到整个刑事司法程序中,从诉讼启动前通过预测性警务来优化资源部署,到立案后通过预测性检察和预测性审判来辅助审查羁押必要性与适用缓刑,再到刑罚执行阶段将预测性算法用于辅助假释、暂予监外执行的决策。我国法学界熟知的再犯风险评估工具COMPAS就是典型。在此背景下,域外学术界开始围绕“预测性司法”(predictive justice)的概念框架观察上述算法预测实践。2022年出版的《数字词典》( Digital Dictionary )正式收入该词条,用于概括2010年以来新一轮人工智能预测算法在法律中的应用浪潮。支持者强调预测性司法的时代意义,认为它可以提高司法决策的可预测性和一致性。反对者则认为预测性司法准确性存疑,担心其无法处理更加基本的司法价值追求,并可能唤起反乌托邦的未来。2024年3月欧洲议会通过的《人工智能法》部分禁止预测性警务的规定,及立法围绕该议题的持续争议可以被视作上述矛盾态度的时代注脚。 

   近年来,我国法学界和实务界围绕预测性司法形成了系列研究成果,但多附带于大数据侦查、智慧法治等研究之中。相关观点可以概括为:第一,预测性司法具有提升司法质量、规范司法运行流程等多重功能和效果。第二,预测性司法在赋能的同时也因为数据和算法层面准确性、透明性等问题,既与无罪推定、平等保护等原则冲突,又与立案、辩护等制度不相兼容。第三,对于前述困境,学者们提出包括明确辅助性地位、建立算法透明制度等建议。目前相关研究未能从总体视角归纳预测性司法将面向预测的证据标准与证据方法纳入刑事司法决策过程的本质特征,也未能有效预见未来可能引发的重大治理问题并提出一体化解决方案。本文尝试将刑事司法领域预测性算法运用的多元实践归入预测性司法的理论框架下,分析其推动我国刑事司法逻辑嬗变以及与我国刑事司法的价值冲突,并基于良法善治的总体要求提出兼顾法律、文化、伦理的协同治理方案。 

  一、预测性司法的历史生成 

  (一)预测性司法概念的生成 

  预测性司法是借助预测性算法挖掘数据之间的联系或模式,自动化预测刑事司法中初犯可能性、人身危险性、再犯风险性等各类具有法律意义的风险事项,支撑司法人员作出逮捕、起诉、缓刑等决策的司法实践总称。相较于回溯证明“已然之害”的传统刑事司法而言,预测性司法是贯穿于刑事司法全过程的围绕“未然之害”预测展开的算法决策机制。由于预测性司法主要在刑事司法中运用,因此也被称作“预测性刑事司法”。 

  近年来,预测性司法应用在全球范围内不断拓展,并可以细分为预测性警务、预测性检察和预测性审判三大场景。预测性警务通常意指通过分析现有数据来预测某一特定时间窗口内可能发生犯罪的地点或人,并指导警务部署和刑事侦查的司法实践。预测性检察包括各类识别嫌疑人未来严重犯罪活动风险并支撑提起指控和参与量刑辩论等检察决策。预测性审判是指基于数据模型对刑事司法中被告人再犯风险、人身危险性等事项进行可能性预测,辅助法官作出缓刑等决策。狭义的预测性司法特指预测性审判。有数据显示,美国有73%的司法区使用包括COMPAS在内的风险预测工具。此外,预测性司法还在英国、法国、德国、意大利、加拿大、荷兰、西班牙、澳大利亚、乌克兰等多国得到应用。 

   尽管预测性司法作为学术术语与实践话语是当代的新概念,但在刑事司法系统内部,预测却并非全新事物,比如基于人身危险性的预测确定强制措施。然而,传统刑事司法中的预测更大程度是一种“临床”方法,依赖个体化的、不受预先确定变量控制的专家经验。随着20世纪中期法律计量学(jurimetrics)的提出,法学界开始日益聚焦对司法行为的定量分析以及设置法律可预测性的计算。其后,精算意义上的刑事司法预测技术开始逐步发展,并推动了从20世纪80年代起刑事司法中风险预测的由“临床”向“循证”的转型。从技术逻辑看,精算预测使用可重复的预测指标体系,通过数据分析验证变量与风险的相关性,从而产生风险的量化概率。刑事司法场景中精算预测的发展与流行反映出莱布尼茨与韦伯意义上的法律可计算性与可预测性结合的尝试。可见,在“预测性司法”的概念流行之前,基于数据评估的各类风险预测工具已经在各国刑事司法环境中使用了数十年。随着大数据、人工智能技术的发展,各类量化预测工具的可靠性得到实质增强。自此,“预测性司法”逐步作为一个专有的司法术语得以生成。它代表着刑事司法预测跳出精算预测后的最新算法预测实例。 

  (二)预测性司法的犯罪学与刑罚学基础 

  从刑事司法制度总体性变迁的深层结构来看,预测性司法是以系统论与运筹学为底色,以失能理论为正当依据,以风险预防为导向的精算司法实践在大数据与人工智能时代的延续与进化。相较于传统犯罪治理理念,它呈现出以下特征。 

  其一,新犯罪治理观将犯罪视作一种不可避免的日常风险。在20世纪70年代之前,西方主流刑事司法理念深受社会犯罪学的影响,认为犯罪与社会结构层面的不平等紧密关联。与之对应的犯罪治理表现为通过改善一般社会条件降低犯罪可能。随着风险社会理念的兴起以及传统犯罪治理成效不彰,犯罪在本体论层面逐步被视作一种剥离道德内涵的、正常的、不可避免的社会风险,其与一般社会条件改善的关系被弱化甚至剥离。在此背景下,刑罚的主要目的就由恢复社会结构转向让被告人受到应有的惩罚。进入20世纪80年代,以“新刑罚学”为代表的犯罪治理理念进一步将刑罚的重点由回溯性惩罚转向预测性控制。自此,传统的刑罚福利主义者的改造话语转向基于犯罪风险治理的惩罚话语。 

  其二,新犯罪治理观将基于风险评估的差异处置视作更高效、无偏见的方案。上述理念以“选择性失能”(selective incapacitation)理论为正当依据,认为“一小部分惯犯要对大多数犯罪负责,而剥夺这一小部分惯犯的行为能力将使整体犯罪率产生指数级收益”。这就要求从刑事司法机构与特定群体之间的互动关系来考虑犯罪治理,强调刑事司法机构对犯罪风险的精准评估与精准管理。对于高风险群体适用高强度治理措施,如长期监禁刑;对于低风险群体则采用低侵入性的治理方案,如社区矫正。 

  其三,新犯罪治理观以系统论与运筹学为底色。在系统论影响下,新犯罪治理观将风险防控作为整个刑事司法系统的共同目标,一体化考量侦查、起诉、审判、执行环节的风险治理。运筹学对统计学、数学模型和算法等方法的强调使得犯罪风险管控任务转化为量化预测犯罪风险。各类精算意义的风险评估工具应运而生,服务于对犯罪群体风险的类型划分并支撑差异化的刑事处遇。概率和风险的语言日益取代临床诊断和报复性处断的话语,刑事司法人员的角色开始由犯罪控制者转变为风险管理者。最终,一种扩张性、侵入性和前瞻性的犯罪治理范式得以产生,以遏制社会不安全感的扩散。随着大数据技术的发展,刑事司法风险预测工具转向新兴的算法分析。从某种程度看,预测性司法是预防性司法在算法时代的实践,是风险社会刑事司法政策对安全和确定性追求的当代延伸。 

  (三)预测性司法的认识论与方法论发展 

  传统刑事司法预测采用的临床判断和精算预测尽管存在方法论层面的差异,但均立基于理论驱动的理性主义认识论。其中临床判断方法主要依据各类犯罪学、心理学等理论中对刑事司法风险的因果关系分析筛选风险预测的核心要素,并通过个案式、临床式、专家式的判断予以运用,是基于已有理论的逻辑演绎;精算预测尽管高度依赖数据,但其数据计算的实质仍是基于理论解释与演绎而生成指标体系并复现因果模型的过程。 

   虽然精算司法和预测性司法对风险的预测都是借助计算来预测,但两者在认识论和方法论上存在本质区别。预测性司法奉行数据驱动的经验主义认识论,通过对给定司法数据集中混杂变量的相关性归纳揭示模式,发现刑事司法风险事件的概率并实现预测,是数据驱动的计算主义给法律治理带来的新范式。其知识以数据而非理论为起点,不关注案件相关要素与人身危险性、再犯风险性之间的因果关系解释。上述认识论在方法论层面的展开便是通过数学结构揭示人身危险性、再犯风险与案件诸多要素之间的同构关系,再将同构关系划归为一种物理意义的方程组。换言之,预测性司法的数据选择、指标确定与模型训练呈现出不受先验理论限制的开放性。相较于小数据时代而言,数据的多样性、穷尽性与细粒度,加上数据计算和分析能力的强化,大数据技术可以实现更加全面、动态和精准的风险分析。随着数据量的提升和算法的优化,预测性司法将可能变得越来越准确。同时,机器学习、深度学习技术也通过其自我强化越来越多地服务于预测性司法的运作。 

  综上所述,临床判断所采用的理论驱动的理性主义认识论对于在数据稀缺和计算薄弱的条件下理解和预测刑事司法风险具有特殊的实用性。精算预测尽管仍采用理论驱动的认识论,但通过数据的充分运用缓解了临床判断主观、非实证、准确性差的不足。预测性司法的认识论则可以不受理论框架限制展开预测,因此它相较于精算预测而言更适合于探索、提取海量的非结构化数据以应对复杂的问题。 

  二、预测性司法的中国图景 

  (一)中国预测性司法的当代实践 

   在我国现有刑事法律规范体系下,对于再犯可能性等人身危险性、社会危险性的判断贯穿于强制措施、酌定起诉、附条件不起诉、量刑、强制医疗、假释、暂予监外执行等诸多环节。可见,预测也是我国刑事法律制度的重要组成部分。近十余年间,我国刑事司法的量化风险预测工具迅速发展并日益转向预测性司法。这得益于公共安全治理的客观需要、顶层设计的大力推进以及政法领域科技创新的前期积累。首先,一段时间以来,我国公共安全潜在风险和隐患仍然存在,安全治理的任务艰巨。预测性司法面向风险预防的犯罪治理观符合我国公共安全治理由被动应对向主动保障转型的思路,是预防性治理传统在当代的延伸。其次,顶层设计高度重视政法场景运用数智技术。习近平总书记强调,要遵循司法规律,把深化司法体制改革和现代科技应用结合起来,不断完善和发展中国特色社会主义司法制度。习近平总书记还指出,“推动大数据、人工智能等科技创新成果同司法工作深度融合”。为落实顶层设计的要求,公安司法机关开始在各自智能化中安排预测性司法的建设任务。比如,2017年最高人民检察院启动“人工智能+检察工作”试点工作,其中“智慧侦监”就要求基于大数据辅助计算犯罪嫌疑人的“逮捕必要性”指数。随着预测性司法的发展,国家层面的数字化、信息化建设的一体化规划也开始将其纳入。2022年发布的《国务院关于加强数字政府建设的指导意见》明确提到加强公安大数据平台建设,提高预测预警预防各类风险的能力。最后,预测性司法在我国取得迅速发展还离不开政法领域长期的科技创新积累。“十三五”开始,政法领域有关预测性司法的科技创新被统合在公共安全之下,并纳入围绕数智技术的风险预测创新。2017年科技部发布的《“十三五”公共安全科技创新专项规划》明确提及通过“基于大数据的特异行为分析、犯罪模式挖掘与犯罪预测技术”“社区服刑及刑释解戒人员重新犯罪预防技术”等科技创新大幅提升“各类犯罪的预防、侦破、打击能力”。 

  从实践看,我国以预测性司法为代表的政法智能化建设带有数字化、网络化与智能化三期叠加和利用智能技术弯道超车的典型特征。在预测性警务方面,“近年来,国内公安机关依托大数据平台建设,利用大数据进行犯罪预测、预警的现象亦非常普遍”。在智慧检务推进过程中,多地检察机关上线了相关的预测性检察智能应用,比如江苏的“羁押必要性审查辅助评估系统”、山东的“相对不起诉量化评估系统”等。在我国智慧法院建设过程中,各类基于预测性算法的量刑辅助系统(含是否缓刑)成为各类智慧办案系统的重要功能模块。截至2019年底,全国支持大数据分析提供量刑参考的法院占73.66%。 

  (二)中国预测性司法的逻辑嬗变 

  刑事司法的预测性技术是社会的产物,技术被选择既取决于技术效能,还取决于围绕技术的社会需求、社会评价等共同塑造的总体制度环境。换言之,刑事司法预测性技术在中西方的实践展开势必产生差异化的现实图景。党的十八大以来,中国加快法治领域现代科技应用,智慧法治领域的进展令人瞩目。从长远看,法治与科技的深度融合是中国未来法治的生命逻辑。作为法治智能化的典型代表,预测性司法凭借良好的制度环境和技术的后发优势加速发展。随着结构性变迁的深度推进与均质分布,我国刑事司法的运行逻辑将可能发生根本嬗变,形成与回溯性司法并驾齐驱的预测性司法范式。 

  1.联结社会方式变迁:从个案控制到泛在联结 

   传统刑事司法通过“个案控制”联结社会,刑事侦查采用“由案到人”和“由人到案”的原子主义侦查模式,侦查过程以具体化、个案化和现实的嫌疑为前提。预测性司法深受以风险预防为导向的犯罪治理观的影响,其关注点从以嫌疑为基础的具像化个案控制转向以风险为先导的抽象化群体画像。侦查中嫌疑的辐射范围向“预测性怀疑”过渡;治理思路也因应转变为在可能发生的犯罪与不特定群体之间建立联系。因此,预测性司法实质改变刑事司法与社会的联结方式。首先,预测性司法将极大地扩张联结的范围。具体而言,预测性司法在方法论上强调数据集的无限扩张,这就势必要求刑事司法系统实时地与虚拟、现实社会联结,以便动态获取数据。其次,预测性司法模糊了联结的边界,使得一般性社会治理与犯罪治理之间的光谱交叠,刑事诉讼的开始与结束变得不确定和模糊。嫌疑作为一种小数据原则,在大数据时代可能变得无关紧要。最后,在监控数量足够多的情况下,新增联结的边际成本可以忽略不计。作为其结果,刑事司法与社会的联结可以在时间上无限拓展、空间上无限延伸。概而言之,传统刑事司法的启动是基于“小数据”离散事实、有限信息,其与社会单一的、定向的、有限的联结在预测性司法中转变为多元的、泛在的、无限的联结。 

  2.参与社会治理方式变迁:从事后回溯到先发制人 

   治理犯罪是刑事司法系统整体参与社会治理的重要方式。传统刑事司法参与社会治理主要遵照回溯导向,由犯罪结果追溯犯罪主体并确定犯罪责任。这符合理论驱动的理性主义认识论从结果到原因的推理逻辑,认为每个刑事案件有且只有一种法律上的因果关系是真实的。在以风险预防为导向的犯罪治理观的影响下,刑事司法开始逐步转向,基于预测性司法的先发制人理念日益流行。数据驱动的经验主义认识论与方法论进一步强化基于智能化技术的预测性司法的正当性。由此,刑事司法正在从回溯导向转向预测导向,遵循“从既存结果推展到潜在结果,从过去时推展到将来时”的底层逻辑。该逻辑通过新兴算法来联结、集成和分析全景式的犯罪数据,从中识别数据相关性与犯罪规律的符号表征,并转化为可反复使用的模型以实现犯罪预测。刑事司法的证明模式也从回溯式证明转向预测式证明,呈现出证明对象上的动态性和变化性,以及证明结果的统计盖然性。 

  3.业务组织方式变迁:从案件驱动到数据驱动 

  无论是犯罪治理观中对运筹学管理主义的强调,还是数据驱动的经验主义方法论的运用,预测性司法对于数据的强调正在改变刑事司法传统的业务组织形式。复杂的、专业的、动态变化的刑事司法业务与挑战被自动化并打包为数据和工程问题。传统刑事司法依照“案件—证据—人”的思维定式,业务组织方式遵循案件先导路径,证据收集主要由公安司法机关围绕个案搜寻直接相关的线索和证据,较少外溢至其他参与者。大数据立基于联结模式之下的建模计算和数理逻辑,奉行“无数据、无知识”的经验主义认识论。数据作为核心要素,直接参与刑事司法的侦查、起诉、审判等业务过程,并推动刑事司法从案件驱动转向数据驱动。 

  4.司法决策理性变迁:从价值理性到技术理性 

  由于法律条文一般存在较大解释空间,因此在很多关键的情景中司法人员需要嵌入价值理性。司法价值的多元性使得价值理性主导下的司法自由裁量权行使存在不一致性与不确定性。在此背景下,工具理性成为跳出司法价值理念的分歧、追寻法律一致性的重要依托。预测性司法在认识论与方法论上强调计算和数学工具在促进理性和高效的刑事司法系统中的作用,本质上是工具理性影响下的技术理性。一方面,预测性司法将决策逻辑从个人判断转变为基于预测工具的算法决策。在此过程中,复杂的刑事风险判断被简化为预先定义的量化分值,以类似于机器的运行逻辑自动产生。另一方面,预测性司法通过预测模型排除与案情无关的因素,为裁量权运行构建约束机制,有利于抵消司法决策中的任意性、偏见与不一致。 

  5. 司法权力归属变迁:从人力决策到算法决策 

  尽管在形式上司法工作人员可以仅将预测性司法工具定位为辅助性,然而自我约束、寒蝉效应、锚定效应和自动化偏见等多重因素影响叠加使得这种个人的最终权力被稀释。其一,预测性司法通过风险预测数据化对司法人员进行侦查指导和裁判指引,无异于通过层层嵌套的技术优势削弱司法人员的自主权力,一定程度上会产生决策让渡现象。其二,客观分数的存在本身就会对司法人员的专业判断产生寒蝉效应。其三,司法人员决策可能会受锚定效应的影响,无意识地被预测性司法评估的结果牵引。其四,技术外衣也会使得司法人员对其产生正向偏见,在没有足够信息的情况下,对技术产生天然的信任感。即使司法人员有理由相信技术存在缺陷,他们仍然可能会倾向于依赖自动化决策的判断。 

  三、预测性司法的内生冲突 

  预测性司法正在引发我国刑事司法运行要素的整体性变迁与结构性嬗变,其意义已远超技术升级本身。作为一种新的司法理念、方法和实践,它不可避免地会与传统的司法价值进行碰撞,甚至是冲突;在动态的司法体系中,它也会与传统的司法价值进行互动,甚至是融合,进而形塑更具有合法性、合理性的司法实践。因而,对预测性司法与传统司法价值关系的研究,不能停留在预测性技术直接影响的外在层面,而是应该在实体公正与程序公正的内在层面梳理它对刑事司法所有参与者权利(力)义务的影响。 

  (一)预测性司法与程序公正的内生冲突 

  程序公正包含尊重、中立、可信、参与四大要素。立法者通过一系列制度设计,赋予并尊重诉讼当事人的各项权利,保障其实质参与刑事诉讼程序。然而,预测性司法的运行逻辑与程序公正的核心要素产生不同程度的内生冲突。 

  1. 预测性司法与尊重度的冲突 

  尊严价值理论认为评价法律程序正当性的主要标准是使人的尊严得以维护的程度,即法律程序内在的价值是否以人类普遍人性为基础。预测性司法与尊重度的内生冲突表现在三个维度: 

  基于刑事诉讼参与人视角,预测性司法数据驱动的业务组织方式通过采集数据经由算法模型推演,生成画像并进行行为预测与评估。考虑到方法论层面对无限扩展数据集的偏好,其势必涉及身份、通讯、健康、行为轨迹、经济状况等个人信息;在算法的支撑下,对个人信息的关联挖掘还可以获取敏感信息甚至隐私信息。同时,由于此种数据采集行为系国家履行职责所需,因而无需充分征得信息主体的同意,由此使得刑事诉讼主体的自主意志被剥夺,沦为客体化和工具化的数字和概率集合,而非目的性和主体性的存在,存在去人格化的风险。 

  基于刑事司法机关视角,预测性司法推动价值理性向技术理性、人力决策向算法决策的逻辑嬗变使得大数据的技术优势以弥散性权力和权威性权力的样态渗透于刑事司法中。由于自我规训等多重要素的影响,此种规训以隐性形态在潜移默化中塑造司法人员的认知。与此同时,司法决策理性由价值理性向技术理性的转向则在显性层面直接约束了司法人员的裁量权。在此过程中,公安司法人员被视作司法机器上的齿轮,对价值的反思被限制甚至排除,以支持预测性司法自我延续的程序和控制机制。 

  基于社会公众视角,预测性司法推动刑事司法联结社会的方式由“个案控制”转向“泛在联结”、参与社会治理的方式由“事后回溯”转向“先发制人”,由此导致对不特定多数人产生近距离的数据分析与挖掘,可能会超出公众在公开场合保持个人隐私的预期,对隐私权产生侵犯。其抵近式的特性突破了维护尊严所必需的合理区隔,对尊严产生直接冲击。 

  2.预测性司法与中立性的冲突 

  虽然预测性司法包裹了中立的科技外衣,但仍然可能裹挟了偏见和结构性不平等。从数据层面看,数据并不天然具有中立性。有研究显示,预测性司法的部分数据集产生于有缺陷执法行为和特殊政策期间产生的数据之上,创建环境和方法使得此类数据存在系统性偏差。此外,机器学习在预测建模过程中排序、分类、关联与过滤等操作的实质是借助算法对各类数据进行嵌入特定选择和价值主张的区别对待。更进一步,预测性司法是基于数据挖掘最大化实现面向风险预防的犯罪治理,带有极强的有罪推定的倾向。当算法将特定主体的犯罪风险界定为真实的,那么公安司法机关工作人员将很可能受到影响而对犯罪嫌疑人、被告人产生先入为主的偏见。作为其结果,预测性司法将可能导致司法决策过程日益行政化(预防政治优先),程序中立性受到侵蚀。 

  3. 预测性司法与可信度的冲突 

  预测性司法可信度有赖于运作原理的透明和可解释。由于算法决策的存在,预测性司法面临“有意的不透明”“无知的不透明”和“内生的不透明”风险。有意的不透明是指基于知识产权、措施有效性等考量而有意选择将算法保密;无知的不透明是指大多数社会成员缺乏必要的技术知识来理解算法;内生的不透明是指机器学习等算法逻辑的不可解释性甚至超过了专家的跟踪和理解能力。三类不透明形塑了三重透明度悖论:第一重悖论体现为预测性算法承载的商业利益与治理效益成为算法保密的正当性事由;第二重悖论体现为算法公开后公众仍然无法有效理解,对于提升算法认知度意义有限;第三重悖论体现为算法逻辑的自演化性从根本上消解了算法公开对于塑造社会认知的意义。上述悖论固化了预测性司法的可信度困境。 

  4. 预测性司法与参与度的冲突 

  对于犯罪嫌疑人、被告人而言,通过参与刑事诉讼,可以成为裁判者的协商者、对话者和被说服者,其程序性权利得以保障。因此,刑事诉讼正当程序要求刑事被告人有权对判定有罪和处罚的证据进行审查和质疑。预测性算法的三重不透明悖论形塑的“解释学不公”使得犯罪嫌疑人、被告人因缺乏足够的语言、概念或知识资源而无法理解或阐明预测性算法对他们造成的伤害。即使充分考虑个体差异,社会共同解释资源的稀缺使得预测性司法对于绝大多数当事人而言在认识论上是封闭的。在数据驱动、工具理性、机器决策等多重逻辑嬗变的影响下,预测性司法运用加剧了刑事诉讼中控辩双方的信息不对称情况,犯罪嫌疑人、被告人难以准确获知和理解预测性司法评估结论生成所依赖的数据和算法,更难以通过参与刑事诉讼程序而影响预测性司法的结果。 

  (二)预测性司法与实体公正的内生冲突 

  所谓实体公正是指案件实体的结局处理所体现的公正,既包括通过惩治犯罪实现的个案公正,也包括依托个案公正形成的总体公正。预测性司法的认识论与方法论及其引发的司法优先度变迁与刑事司法的实体公正形成不同程度的内生冲突。 

   第一,实体公正的前置条件是正确认定案件事实,预测性司法奉行数据驱动的经验主义认识论与方法论,遵循“数据→知识→运用”的技术逻辑,其结论准确性受数据数量和质量限制。一方面,预测性司法的基础数据欠缺周延性,难以对所有影响输出结果的因素都予以数据化和指标化。事实上,真正意义上完全中立化的全样本很难实现,实践之中的全样本都是有限时间和空间范围的主观选择。另一方面,现有大数据预测技术难以精确抽取刑事司法决策中的隐性要素,也无法充分应对证据认定和司法推理过程的复杂性。由此导致即便能在时间和空间双重维度穷尽所有数据样本,隐性要素的缺失也将制约预测性司法基础数据的客观性与准确性。更进一步,预测性司法以人的社会行为(犯罪行为)为研究对象,社会行为系人与人的互动结果,导致现实的刑事司法实践产生数据带有随机性和不确定性。这使得在密闭的数理预测模型中,基于多源、异构、复杂以及包含主客观的基础数据,难以完全拟合刑事司法实际,其对于刑事司法各类风险事实的表征也难以达到绝对精确。正因如此,预测性司法需要不断根据预测结果的有效性而动态调整,呈现出动态试错的特征。 

  第二,预测性司法的逻辑嬗变使得个案实体公正与整体实体公正发生错位。在实体公正的理论架构中,整体正义是建构在个体正义的基础之上。然而,预测性司法的算法运作是从大量现象中进行高度提纯,考量的是共识性的整体规律和价值,由此导致大数据的同质化技术路径与刑事司法的个案正义路径产生抵触,具体表现在:一方面,预测性司法遵循的大数据技术逻辑使得异质性被同质性吞没,个别性要素被剥离和忽略;另一方面,随着算法深度学习能力的提升,其逐渐具备强大的自主学习能力,可以进行自主建构和自适应,能将训练样本的某些细节特点视为一般规律予以学习,也即出现常见且难以克服的“过拟合”现象。由此导致预测性司法应用在提炼一般规律时将个案误差上升为指标误差、测量误差,以类案形式发挥普遍作用,对刑事司法的实体公正产生侵害。 

  第三,预测性司法的逻辑嬗变可能引发系统性实体不公。预测性司法将法律层面的确定性与数学层面的确定性耦合,可能导致刑事司法领域决定论的死灰复燃。数据和算法偏见不仅会直接影响受刑事司法大数据应用作用的特定人群,还会在计算机模型中不断复刻和放大,对制度体系中已存偏见的发生密度和执行力度产生持续性强化作用,偶发的、零散的歧视行为将逐步趋向常态化和制度化,影响刑事司法资源在不同主体之间的分配格局,重塑刑事司法权利与权力格局,最终导致偏见所引发的个案不公将逐步异化和演变为类案不公。 

  四、预测性司法的协同治理路径 

  所有治理手段都必须“服务于当下中国不断深化改革发展的时代潮流,致力于推进国家治理体系和治理能力现代化”。预测性司法是深化我国司法体制改革的一种技术实践。推动此类数据驱动的、面向未来的司法决策范式,需要遵循更加谨慎、透明和负责任的方法。这就要求在预测性司法的应用与规制之间着力建立一种持久和动态的协同与平衡机制,既回应国家治理的客观需求,又规制预测性司法滥用带来的潜在风险。 

  (一)协同治理路径之提出 

  党的二十大报告提出,“以良法促进发展、保障善治”。对预测性司法的治理应当遵循良法善治的指引,从中国智慧法治的实际出发、在总结预测性司法成功经验的基础上建构自主的路径。良法善治不仅强调立法质量,希望造就“良法”,更强调文化认同层面的“善治”。换言之,良法善治需要摒弃单纯强调形式合法性的理念,既在“良法”层面调适预测性司法与刑事司法的价值冲突,又在“善治”层面借助文化认同与伦理规范实现对预测性司法的协同治理。 

   如何协调法律、伦理与文化要素,以实现预测性司法的良法善治?笔者认为,应当将预测性司法与我国刑事司法价值的内在张力视作因制度冲突而产生的合法性困境,在此基础上将法律、伦理与文化视作整体性的制度框架,并从总体合法性的视角一体化构建应对方案。对此,可以从以下几个方面分析:其一,预测性司法在本质上是侦查、起诉和审判机关的组织行为,其与刑事诉讼价值的冲突即为组织行为与所处制度环境碰撞后产生合法性危机。其二,面对合法性危机,公安司法机关需要调适行为以适应制度环境进而获得行动的合法性。其实质是将组织行为塑造得符合社会共同意识和认知系统的要求,不断接受和采纳外界公认和赞许的形式、做法或社会事实的过程。其三,在中国特色社会主义法治体系中,对法律规范体系的定义是多元的,除法律外,还包括各类软法在内的社会规范。因此,制度环境并非只有法律的单维存在,而是一种规则、规范、信念和认知的综合体。公安司法机关不能仅仅适配法律体系,还需要回应各类社会规范和文化认知的要求,获得一种总体合法性。其四,在总体合法性的框架下,公安司法机关为消弭预测性司法与刑事司法价值的冲突,就需要协同法律规范、文化认知和道德伦理等维度的制度需求,通过遵守法律、规章等规制性要素获得规制合法性;通过文化认知性要素中的制度认同,重塑价值认知和观念获得认知合法性;通过遵循规范性要素中的非正式的伦理、义务和责任获得规范合法性。 

  (二)规制合法性:预测性司法的合法性归化 

  在预测性司法进入刑事司法决策的过程中,先发制人的案件调查过程事实上合法化,基于预测性算法产生的具有不确定性的证据进入刑事司法程序。因此,应以对刑事诉讼参与人最低侵入为原则,一方面,确保围绕预测性司法的审慎创新,保障部署的合规性;另一方面,将预测性司法放置到现有刑事司法的制度体系中严格约束,从而获取预测性司法的规制合法性。这也是良法善治最为基础的要求。 

  1.以比例原则确保预测性司法的合规部署 

  作为面向风险预防的犯罪治理工具,预测性司法可能对诉讼参与人的权利形成直接影响,且在数据处理过程中涉及个人信息甚至个人隐私,因此国家机关应该承担严格的注意义务,按照比例原则进行适当性和必要性的综合判断,审慎推动预测性司法的大规模部署。 

  首先,适当性原则要求预测性技术的部署必须有助于实现刑事司法改革目标。这又可以从合规评估与效能评估两方面展开。对于合规评估而言,国家机关要严格审查预测性司法的开发主体是否建立了完善的数据治理、透明度治理、风险管理等内部治理机制,一方面,在全生命周期关注数据来源的合规性,在必须涉及个人信息甚至隐私时,严格遵循目的限制和数据最小化的原则,确保收集个人信息的数量以满足目的实现为必要且仅用于预测性司法的评估所需;另一方面,重点关注增强算法透明度与歧视检测等机制的有效性。在部署前和部署后实施强制性的歧视检测。对于效能评估而言,需要重点关注算法的可靠性与精准性,严格限制仅根据个人特性指标构建的预测性司法应用。 

  其次,必要性原则要求预测性司法工具必须以对刑事司法参与人侵入性最小的方式进行。这就要求严格约束适用场景、主体、条件。对于针对不特定多数人的预测性警务,需要采用比技术性侦查更加严格的适用标准,仅能应用于危害国家安全、恐怖活动等严重犯罪类型且需经市级以上公安机关负责人逐案批准而适用。 

  2. 预测性警务的法律属性及其规制合法性 

  立案是重要分水岭,侦查机关以此为界限获得对嫌疑人采取侦查措施和强制措施的权力。按照《公安机关办理刑事案件程序规定》(以下简称《公安程序规定》)第174条的规定,立案可以源于公安机关主动发现犯罪线索。线索不明的,经批准可以“调查核实”。由此,构建了“发现犯罪线索→调查核实→立案”的立案前流程。可见,预测性警务应被视作侦查机关在立案前借助大数据与人工智能工具,依职权进行的违法犯罪线索发现、收集、甄别、挖掘的行为。 

   在明确了法律属性之后需要确定两个问题:(1)作为刑事立案前的职权行为,预测性警务所指向的线索发现行为需要受到何种约束?(2)预测性警务发现的线索是否足以启动调查核实或者立案?根据现行刑事诉讼法律规范,立案之后经过法定程序可以直接与嫌疑人接触,且采取直接影响嫌疑人人身或者财产权利的强制措施,同时可以在特定案件中启动技术侦查措施;在受案至立案之间的调查核实中,可以与所涉人员直接接触(如询问),但不得限制被调查对象人身和财产权利,也不得采用技术侦查措施。可见,立法在事实上区分了立案前与立案后,对措施强度进行了差异化设计。由此,从体系解释看,立案前公安机关依职权获取犯罪线索,其强度应当显著低于调查核实。故而,预测性警务只能采用非接触式的、静默式的手段,以被调查人无感的行为进行。同时,预测性侦查获取相关信息的行为强度必须显著低于技术侦查,如只能主要依托公开数据等。 

  对于第二个问题,需要明确预测性警务的结果不能单独构成立案依据。这是因为其获得信息只涉及特定主体犯罪可能性,尚不足以确认特定主体有犯罪事实。根据《公安程序规定》第174条的规定,作为概括性的犯罪线索,若无法支撑刑事立案,可以视作线索不明;只要办案部门负责人批准,可以启动调查核实。因此,只有预测性警务获取的概括性线索结合调查核实获得的信息与个人形成特定关联,并且将嫌疑概率提升到足够强度的,才可启动立案。 

  3. 预测性检察和预测性审判的法律属性及其规制合法性 

  相较于预测性警务而言,预测性检察和预测性审判均是在刑事案件立案后针对特定对象展开,具有内在属性的一致性。对于规制合法性而言,需要在现有法律规范体系内探讨上述职权行为获得的预测性结果究竟是刑事证据抑或是参考资料,以及犯罪嫌疑人/被告人对上述结果享有何种抗辩权利。 

   首先,从解释论的角度看,预测性结论可能被视作调查评估报告或专门性报告。(1)调查评估报告:《最高人民法院关于适用〈中华人民共和国刑事诉讼法〉的解释》(以下简称《高法解释》)第282条规定,人民检察院提出建议宣告缓刑时,一般应当附有调查评估报告。同时,根据《关于适用认罪认罚从宽制度的指导意见》第36条,人民检察院拟提出缓刑量刑建议的,可以委托调查评估或自行调查评估。因此,可以将预测性司法与调查评估制度结合,转化为针对社会风险性的调查评估报告。(2)专门性报告:现实中的专业性问题层出不穷,司法鉴定却非常有限。因此,大量关于专门性问题的报告被用于证明案件事实,发挥着与鉴定意见同等重要的作用。《高法解释》第100条因应司法实践需求,规定因无鉴定机构,指派、聘请有专门知识的人就案件的专门性问题出具的报告,可以作为证据使用。由于社会危险性的评估尚无鉴定机构,若公安司法机关基于案件办理而指派、委托专门知识人结合预测性工具作出的专门性报告可以作为证据使用。从预测性司法的发展看,应该将其人身危险性的评估结论视作调查评估报告。这是因为目前预测性司法在准确性、规范性、客观性和统一性等方面都还存在不足;实践中缺乏统一指引,主体、程序与标准不明,不宜直接认定为证据。随着预测性司法技术的发展以及报告制作方式和程序规范化——由受过专门职业训练、掌握科学调查方法的专家基于预测性工具出具详细的社会风险性报告——则可以升格认定为目录外证据专门性报告。 

  其次,根据最高人民法院、最高人民检察院、公安部、国家安全部、司法部《关于规范量刑程序若干问题的意见》第3条,调查评估报告仅仅属于人民检察院和人民法院办案的参考资料,而非定案依据。对此,当事人及其辩护人、诉讼代理人仅可以根据《高法解释》第282条对于人身危险性的预测报告提出意见并说明理由。对于符合规范性要求并认定为专门性报告的证据而言,可以将其放置到证据法现有的体系内对嫌疑人和被告人的质证权利进行保障。由于评估结果可能影响缓刑适用,依据《高法解释》第268条应当“单独举证、质证,充分听取质证意见”,必要时可以申请有专门知识人出庭。 

  (三)认知合法性:预测性司法的信任感提升 

  预测性司法认知合法性的获得,需要社会公众、公安司法工作人员和技术开发人员在观念上对其产生高度的价值认同感,将其视若当然。这就势必要求预测性算法遵循一种涵盖概念、经验与技术的价值敏感设计路径,在设计过程中以原则性和全面性的方式考虑司法价值追求,推动技术人员与司法工作人员、社会公众的深度商谈与互信。 

  1.面向三重透明度悖论的算法治理 

  由于认知合法性源于社会公众和刑事司法参与人员对预测性司法的整体文化认知,因此算法透明度是至关重要的价值,它有助于保障公众的知情权、防止公安司法机关的不当行为,从而产生更好的社会信任。前文已经提及,预测性算法面临三重悖论,因此需要结合刑事司法场景的需求,按照适当透明的理念与路径,差异化选择适配不同主体的算法公开与解释方案。 

  首先,针对有意的不透明导致的第一重悖论,应该构建内外有别的算法可解释性方案。预测性算法的完全透明除了受知识产权约束外,还与算法本身有效性密切相关。因此,按照价值平衡的基本思路,技术路径、数据参数、权重设定等技术要素和细节仅在特定条件下向内部或外部审计机构或公共机构提供访问权,这些主体在依法、依约履职时可以测试预测性算法的效能。可见,适当透明将完整意义上的技术细节公开的对象限定在特定授权和具备必要技术专长的专业监管机构。事实上,无论司法人员还是公众,都不太可能拥有评估风险预测工具技术细节所需的专门知识。同时,适当透明还要求预测性算法的设计主体从全局性和局部性两个维度提供必要的解释性信息。这一点在第二重悖论部分一并展开。 

   其次,针对无知的不透明导致的第二重悖论,应构建全局性和局部性两个层面的算法动态解释路径。预测性司法的全局性解释主要针对总体算法考量的因素以及历史的准确性,包括系统的测评结论、算法的基本逻辑、指标所占权重、依据及其置信区间、相关数据变化会对决策产生哪些方向性影响等内容。局部性解释则特指特定案件嫌疑人、被告人对算法评估的影响因素,也就是哪些情节被输入并在何种程度上影响了预测的结果。全局性解释为社会公众理解预测性司法的基本原理和实际成效提供必要基础,而局部性解释则为被告人有针对性辩护提供有效保障。可见,在适当透明的框架下,公众算法知情权仅及于算法的总体概况,而不包括底层代码等细节。同样,司法人员只需依据上述信息判断模型是否考虑了歧视性的因素,以及模型是否充分考虑被告人的特殊情节。如果司法人员希望了解算法的技术性细节,则可借助第一重悖论中算法公开指向的专业机构并结合专家证人的制度进行诉讼化操作(依申请不公开审理)。 

  最后,针对内生的不透明导致的第三重悖论,应当推动预测性司法中广泛使用可解释性深度学习技术框架。目前,深度学习的可解释化是人工智能技术重要的研究领域。既有方案包括基于结构化学习和基于多模态学习的深度学习等多种路径。对于预测性司法而言,在算法选择时要及时吸收可解释性深度学习的最新成果,在模型训练时嵌入法学领域知识,提升预测性司法模型的可解释性。 

  2.基于精准与公平双重目的的数据治理 

   由于预测性司法涉及公民的重要基本权利,其准确性价值要求高于一般领域,因此在预测性司法的设计与应用过程中,要对精准性保持高度敏感。这就需要推动“数据驱动的经验主义”认识论与“轻量级法学理论驱动”的认识论相融合,广泛利用相关法律专业人员的专业知识,对数据获取、领域本体构建、数据标注、算法选择、模型训练的全过程进行优化。在此基础上,在技术开发的全流程贯穿去偏以确保公正价值。首先,在事前数据获取和标注层面,应在研发专家和法学专家的共同论证之上,严格筛选算法训练过程所需的数据样本,并通过先验知识对数据样本进行清洗,减少价值判断的渗透性影响。同时建立数据重复识别匹配规则和匹配链接规则,对标注样本库质量进行评估,排除歧视性数据。其次,在事中算法选择和模型训练方面进行必要的管控,有效实现预测结果的去偏。最后,在事后环节消除或减少相关预测变量(如民族、性别)对预测结果的影响。 

  (四)规范合法性:预测性司法的伦理性强化 

  从数字社会学的角度来看,预测性司法的规范合法性困境来源于开发与应用过程中数字资本分配不均。所谓数字资本,是指获得创造和利用数字技术的全部优势所需的内部能力、自身资质与外部资源的总和。它赋予特定主体在数字技术开发与运用场域内以特定权力和优势地位。在技术人员与司法人员、国家机关与诉讼参与人两组关系中,前者在预测性司法的设计、部署与应用过程中往往占有更明显的数字资本。这意味着后者的领域价值观与群体需要难以被充分纳入技术设计与应用的框架内考量。因此,应当扭转数字资本的分配不均,强化司法人员、诉讼参与人员对预测性司法的伦理控制机制。 

  1. 以轻推为限度确保司法人员的决策自主性 

  在预测性司法的场景中,理想的状态是明确预测性司法仅能起到辅助性作用,最终决策仍需由司法人员审查后自行作出。然而,考虑到算法决策的逻辑嬗变,“人在回路之内”的底线伦理规范可能会退化为“人在回路之外”。此时,必须明确预测性司法以轻推为限度,保障技术人员与司法人员之间的数字资本均衡分配。 

  轻推是指在保留个人选择自由的前提下,借助正向强化与间接建议,影响群体或个人的行为和决策。预测性司法要获取规范合法性,必须在伦理上强调以轻推为限度,强调正向强化、间接建议和轻易绕开三大要素。其一,预测性司法应该以正面强化为限度,通过强化司法人员对于被告人社会风险性判断的自由心证而辅助决策,不得强制司法人员接受评估结果。其二,预测性司法应以间接建议为限度,仅仅提供被告人、犯罪嫌疑人的风险系数或者数值,而不能直接得出缓刑与否或者逮捕与否的结论性意见。其三,预测性司法不能显著增加不参考预测工具结论司法人员的负担,或者可以通过低成本的方式轻易绕开。换言之,不得在司法人员不参考预测性工具结论时要求增加说明或者审批的程序。 

  2.以关系伦理学保障诉讼参与人的有效参与 

   在国家机关与诉讼参与人的二元叙事中,国家机关掌握着预测性司法的数字资本,诉讼参与人尤其是被告人作为预测性司法结果的直接作用者,却几乎不掌握任何的数字资本,由此他们的诉求在预测性司法的研发与部署的全过程中容易被忽视。这在根本上违背了关系伦理学的基本要求。关系伦理学通过参与性认识论以更广泛的方式重新思考伦理学,将最受影响和最边缘化的人的需求置于中心。按照这样的思路,为了诉讼参与人的有意义的参与,必须提供资源扭转数字资本的不平等分配,赋予受预测性司法影响的被告人一方控制机制。其一,确保诉讼参与人的知情权。一方面,诉讼参与人必须在司法程序之前或过程中被明确告知预测性司法(预测性警务除外)对案件的任何事先处理,并有权提出异议。另一方面,应明确采用以诉讼参与人为中心的解释方式,以通俗易懂的方式向公众或相对人告知算法对主体的影响。同时,机器学习的算法在模型生成过程中会不断基于新的数据而优化。这也意味着必须建立动态性解释框架,及时反馈算法与模型的调整情况。其二,确保诉讼参与人不受司法自动化决策的权利。国家专门机关不得基于预测性算法而自动化作出可能对诉讼参与人的重要权利形成实质影响的决策,如逮捕、起诉、缓刑等。 

  结语 

  从技术与社会双向塑造的视角看,当我们在刑事司法中发明预测性技术时,它们可能也在以自己的方式反过来重新发明了刑事司法。对预测性司法的未来想象,不可轻易落入乌托邦式决定论或者反乌托邦式决定论的两端。在数智技术编制的“无缝之网”中,需要警惕单纯的功利主义司法哲学,应当从强调人的价值角度充分约束预测性司法的运用,有效规避预测性司法的风险,并将其正面可供性提升到最大程度。当然,更值得思考的问题还在于,社会是确定性与不确定性的矛盾集合体。人类行为的不确定性,从短期看降低了行为的可预测性,并形塑人与人之间双重相互预期的脆弱性,但从长远看却滋养了社会的灵活性与稳健性。因此,保持预测性司法在确定性基础之上的开放性,也是推动司法创新、维持司法生命力的本源所在。 

  〔本文注释内容略〕 

  原文责任编辑:刘鹏

转载请注明来源:中国社会科学网【编辑:苏威豪】