当司法拥抱算法,正义与科技谁将笑到最后?!
2017年4月11日,美国首席大法官罗伯茨在与纽约伦斯勒理工学院校长的一场对话中被后者问道,“你能否预见将来有一天,AI驱动的智能机器将协助法庭认定事实,甚至颇具有争议地介入司法裁决程序?”
“这一天其实已经到来,” 大法官罗伯茨说,“而且这已经让司法实务的运作方式面临着巨大的压力。”
这位大法官说的并不只是高精尖的AI技术,当然更包括随身携带的智能设备、DNA生物技术等科技革命给传统证据基础上的事实认定带来的冲击,以及旧时代滞后的法律在技术革命新环境中的适用和演变,但最具有争议的是,司法实践中掌握国家机器的司法机关使用甚至依赖技术行使裁量权时,难免让人开始思考改变世界的科技技术进步与公平正义等社会目标之间的微妙关系。
本文中,简法帮以美国威斯康辛州最高法院的一个法院判例来分享美国司法机关已经广泛使用的一个风险评估工具所面临的程序正义问题。
概述
最初,风险评估技术工具仅由缓刑和假释部门使用,用来帮助确定违法者的最佳监督和处罚方式。随着国家对减少重新犯罪的关注和注重证据的司法实务的发展,现在这种工具的使用已经扩大到了量刑的司法实践中。然而,这些工具在量刑中的使用则更加复杂,因为风险评估工具主要面向减少重新犯罪的目标,而司法判刑则具有多个目的,譬如(1)威慑,(2)救助,(3)惩罚,(4)隔离。
使用特定的以证据为基础的风险评估工具进行判刑就是这个案例的核心问题。在量刑过程中使用COMPAS风险评估工具是否侵害宪法规定的正当法律程序权利(简法帮注:正当法律程序权利源于英美法系,主要是指任何权益受到判决影响的当事人,都享有被告知和陈述自己意见并获得听审的权利。),就是美国威斯康辛州上诉法庭向该州最高法院提请裁判的具体问题,因为COMPAS工具的专有保密性质让被告无法对COMPAS风险评估的科学效力提出质疑。
被告Eric L. Loomis(以下简称被告)认为,一审法院在判刑期间对COMPAS风险评估的考虑违反了自己的正当法律程序权利。
威斯康辛州最高法院得出的结论是:如果使用得当,并遵守其明确要求的限制和注意事项,法院在判决中考虑COMPAS风险评估并不违反被告享有的正当法律程序宪法权利。
最终,由于一审法院考虑COMPAS工具风险评分时具有其他独立因素的支持,技术工具的使用并没有发挥决定性的作用,所以威斯康辛州最高院认定一审法院判决被告入狱六年并没有不当行使自由裁量权。
法官量刑使用算法技术工具的一个案例
这个案件的事实没有争议。公诉人认为,被告是一起飞车枪击案的驾车人。公诉人指控了五项罪名:(1)一级肆意危及安全罪,(2)交警抓捕逃逸罪,(3)未经车主同意操控汽车罪,(4)罪犯持有枪支罪,(5)拥有短管霰弹枪或步枪罪。
被告否认参与飞车枪击。他放弃了庭审权利,在与公诉人的控辩交易中(简法帮注:美国的控辩交易是指在司法审查的前提下,刑事案件的检察官和被告双方达成满意的倾向性意见的程序;通常是以检察官撤销指控、降格指控或者要求法官从轻判处刑罚为条件,来换取被告人的认罪答辩,进而由控辩双方达成均可接受的控辩协议),该被告对两项较轻的罪名指控做出认罪答辩,也就是前文的第2项和第3项罪名。
在接受被告的认罪答辩后,一审法院裁定开始量刑前调查。政府量刑前调查报告(下称“量刑报告”)的附件中包括一个COMPAS风险评估的附件。
COMPAS是Northpointe公司设计的一款风险需求评估工具,在狱政局做出入监决策、管理囚犯和规划惩治时能够用来提供决策支持。COMPAS风险评估依据的信息从被告的犯罪档案和与被告的访谈中采集。
COMPAS报告包括旨在预测再犯的风险评估,另外还有用来确定就业、住房和药物滥用等领域项目需求的单独评估。COMPAS报告的风险评估部分会生成条形图显示的风险评分,其中三个条形格分别代表审前再犯风险、一般再犯风险和暴力再犯风险。每个条形格显示的被告的风险级别落在从一到十的区间内。
风险评分旨在预测具有类似犯罪历史的人在被释放后不太可能或更有可能再次犯罪的一般可能性。然而,COMPAS风险评估并不能预测特定罪犯个人再次犯罪的具体可能性;它是基于特定个人信息与类似(人群)数据组的比较而提供的预测。
该案例中被告的COMPAS风险分数显示他在全部三个条形图上都呈现了重新犯罪的高风险。他的量刑报告包括了如何使用COMPAS风险评估的说明,警示了不当使用评估结果的风险,并且说明了它应当用于确定可以从干预措施中受益的囚犯以及在监督期间应该处理的风险因素。量刑报告还警示:COMPAS风险评估不应该用于确定量刑的幅度以及罪犯是否应当采取监禁措施。
此外,该案件中的COMPAS报告的确显示了被告的高风险和高监管需求:暴力的风险很高,再犯的风险很高,审前风险也高;所以这些都是决定适当量刑的因素。
最终,一审法院参考了COMPAS风险评分以及其他判刑因素判决驳回了缓刑的请求:“通过COMPAS评估,您被确定为对社区构成高风险的个人”。在衡量各种因素方面后,一审法院驳回缓刑请求不仅基于犯罪的严重程度,而且因为被告的“过往历史、监管措施历史以及所使用的风险评估工具”都表明了被告再次犯罪的风险极高。
于是,法院针对被告在控辩交易中认罪的交警抓捕逃逸罪和未经车主同意操控汽车罪两项罪名分别判处了两年和四年的入狱监禁及后续狱外监管措施。
接着,被告提请一审法院开庭听审其认罪后的量刑异议。他认为,一审法院在量刑时对COMPAS风险评估的考虑违反了他在宪法下的正当法律程序权利。
在庭审中,一审法庭论证了正当程序问题。被告提供的专家证人指出在量刑时使用COMPAS风险评估的问题。专家证人认为,不应将COMPAS风险评估用于决定是否采取入狱监禁的判决,因为COMPAS风险评估不是为此而设计的,法院这样做的巨大风险是过高估计犯罪人的风险并导致误判或者基于不相关的因素做出量刑决定。
该专家证人进一步指出,量刑法庭对于COMPAS评估如何分析风险的信息知之甚少:“法院不知道COMPAS到底如何将被告个人的历史与与之进行比较的基础人群进行比较。法院甚至都不知道对比人群是威斯康星人口,纽约人口,加利福尼亚人口……各种各样的信息法庭都没有,而我们(风险评估工具)现在的做法是径直将这些分值图放在法官面前让他们将之用于刑罚,这样会误导法庭。”
一审法院最终还是驳回了缓刑的请求,同时解释说使用COMPAS风险评估是为了验证该院自己的认定,无论量刑过程中是否考虑COMPAS风险评分,该院都会做出同样的量刑结果。
被告提起了上诉,上诉法院将该案子提请到威斯康辛州最高法院。
司法拥抱算法时的正当程序权利问题
量刑时能够使用COMPAS其实并不是一个新鲜的做法,威斯康辛州上诉法院在之前的判例中就支持了某初审法院量刑时对COMPAS评估的参考,并指出“COMPAS只不过是法庭在量刑时可以使用的一种工具”;但与本案例不同的是,该判例中没有提到正当程序的宪法权利问题。
但是,法律界不乏质疑的声音,担心工具的作用被过分看重和滥用。
该案件中,狱政局在量刑报告里就承认了工具的局限性:需要记住的重要一点是——风险评分不应用来确定量刑的幅度以及罪犯是否应当采取监禁措施。
威斯康辛州最高法院表示赞同,并在分析该案件中正当程序权利的问题后提出了必要警示的要求(见下文算法量刑到底靠不靠谱?)。
被告最初主张,COMPAS工具的专有保密属性让他无法对风险评估的科学有效性提出质疑。因此,被告认为,由于量刑报告中附加了COMPAS风险评估的附件,被告被剥夺了获取量刑报告全面信息的机会,因此无法确保自己基于准确信息而获得量刑的权利。
COMPAS的开发商Northpointe公司认为COMPAS是自己专有的工具,构成商业秘密。因此,该司没有公开披露风险评分到底如何确定以及评估因素的权重到底是怎样的。被告认为,由于COMPAS不披露这些信息,所以他没有得到一审法院量刑时使用的全部信息,基于以往判例类比认为自己的正当法律程序权利受到侵害。
也就是说,被告认为他是最适合反驳或解释自己COMPAS风险评估结果的人选,但仅仅看条形图反映的分值让他没法有效反驳或解释。此外,被告还认为,除非他能够查看工具背后这些因素是如何衡量的以及风险分数是如何确定的,否则COMPAS评估的准确性无法验证。
威斯康辛州最高法院则并不同意。该院指出,尽管被告无法查看和质疑COMPAS算法如何计算风险,但他至少可以审查并质疑量刑报告附件所载风险分值;因此,该案中被告并非没有机会获取法院依据的信息进行反驳、补充或解释。
威斯康辛州最高法院认为,尽管风险分数没有解释COMPAS程序如何使用信息来计算风险分值,但Northpointe公司COMPAS实务操作指南中解释过风险分值主要基于犯罪历史等静态信息和犯罪同伙、药物滥用等少数动态变量。
被告量刑报告中附录的COMPAS报告中就包含了21个静态信息方面的问题,例如:
此人在假释期间多少次被羁押?5+
此人在试用期间有多少次新的收费/逮捕?4
此人以前被逮捕(仅限刑事拘留)了几次?当时成年还是未成年?12
因此,威斯康辛州最高法院认为,被告的风险评估是基于他对这些问题的答案以及其犯罪史的公开数据,从这个意义上讲,被告完全有机会核实COMPAS报告中列出的问题和答案是否准确;一审法院和被告能够看到的是相同的风险评估报告。被告有机会通过辩解其他因素或信息来质询风险分值的不准确性。
算法量刑到底靠不靠谱?
美国使用COMPAS的一些州已经对COMPAS进行了验证研究,认为它是一个足够准确的风险评估工具。纽约州刑事司法服务局进行了一项研究,审查了COMPAS评估的重新犯罪量值的有效性和预测准确性,并得出结论认为:重新犯罪量值实用有效,并且预测准确性取得了令人满意的结果。与纽约州和其他州不同,威斯康星州尚未针对威斯康星州人口完成COMPAS统计验证研究。
另一方面,被告也找到了对风险评估工具的其他研究所提出的准确性方面的质疑。例如,他援引了2007年加利福尼亚管教和康复局的研究,结论是虽然COMPAS似乎在可以评估犯罪成因需求和再犯风险,但“几乎没有证据表明这是COMPAS实际评估的内容”。
加利福尼亚研究报告进一步得出结论,“没有明确的证据表明COMPAS可以由不同的评估者给出一致的评分,也没有明确的证据表明它可以评估其旨在评估的犯罪成因需求或者(非常重要的是)可以预测加利福尼亚管教和康复局囚犯的再次犯罪风险。”最终,该研究的作者没有推荐加利福尼亚管教和康复局针对个人使用COMPAS工具。
然而,随后加利福尼亚管教和康复局又发表了2010年关于加利福尼亚COMPAS验证研究的最终报告。2010年的研究得出结论,尽管并不完美,但“COMPAS是一个可靠的工具”。
除了这些问题之外,还有一些人担心风险评估工具可能会将少数群体犯罪者的比例过高地归类为更高的风险,包括家庭背景、教育和种族等各种不可控制的因素。
所以,威斯康辛州最高法院要求,使用风险评估工具的法域必须确保他们有资源、有能力维护这些工具并监控其持续准确性。
针对法院在量刑中使用所涉及的准确性问题,威斯康辛州最高法院决定使用COMPAS风险评估除了前文所述的限制之外,还必须遵守一些注意事项。具体来说,任何含有COMPAS风险评估的量刑报告都必须告知量刑法庭关于COMPAS风险评估准确性的以下注意事项:
COMPAS的专有保密性质导致无法公开披露风险评分到底如何确定以及评估因素的权重信息;
风险评估将被告与全国范围的样本进行比较,但对威斯康星州人口的交叉验证研究尚未完成;
对COMPAS风险评估分值进行的一些研究提出问题,质询是否存在少数群体犯罪者被不均衡地认定为重新犯罪高风险的情况;
随着人口结构的不断变化,风险评估工具必须不断监测和调整以维护准确性。这样,量刑法院才能够更好地判断风险评估的准确性并赋予风险分值适当的权重。
尽管如此,威斯康辛州最高法院明确认可了COMPAS风险评估的作用,并且援引了印第安纳州最高法院观点:这些工具有助于法院衡量所有量刑因素。与此同时,COMPAS风险评估依据群体数据判断高风险罪犯群体,而不是特定高风险的个人;所以,量刑法院针对每一个被告个体在考虑所有量刑因素时都应当注意这一点,而且COMPAS风险评估不能构成量刑的决定性因素。
算法=正义?元芳,你怎么看?
科技的进步在挑战社会的每一个细胞,包括经济、政治和生活方式等方方面面,就连司法体系这些维系社会公平和正义的社会机制也不例外。当算法工具这样的科技成果逐渐浸入司法实践中甚至影响量刑这样重要的国家行为中时,难免让人开始担忧是否真的在不远的未来,AI驱动的智能机器等技术工具不仅仅是协助性介入司法机关对法律的解释和执行,甚至逐步发挥更加重要的主导作用。
换句话说,人类会将同类的命运或者公平正义等核心价值的落实交给人类发明创造的算法等技术工具吗?
美国联邦最高法院大法官罗伯茨听起来保持着开放的态度,而且越来越多的法院也在拥抱技术的进步,威斯康辛州最高法院在这个案子中就这样乐观且务实地评论:
在量刑过程中分析使用以证据为基础的风险评估工具,务必考虑到诸如COMPAS等技术工具的变化和演进。我们今天面临的担忧,今后可能会随着工具的完善得到缓解。刑事司法系统应该认识到,在未来时间里,可供使用的研究数据会越来越多,各种各样更好的工具将会被开发出来。随着数据的变化,司法部门使用的工具也必须随之改变。司法部门必须跟上研究的步伐,必须不断评估这些工具在司法实践中的使用。
最后,无论你愿意或是不愿意,司法拥抱科技进步的明天已经到来,至于公平、正义、效率等社会价值目标在司法拥抱技术之后最终究竟会茁壮成长还是黯然失宠?我们拭目以待。
元芳,你怎么看?
资料来源:本文案件事实内容主要来源于威斯康辛州最高法院的判决书,判决书原文链接为:http://www.scotusblog.com/wp-content/uploads/2017/02/16-6387-op-bel-wis.pdf