G遗传物质是现代犯罪现场的确凿证据。在刑事审判中,陪审团经常被鼓励认为DNA图谱是一门精确的科学,通过皮肤、头发和血液的蛛丝马迹,可以精确地识别罪犯,并排除任何错误身份的可能性。然而,统计数据却告诉我们一个不同的故事。
从构成人类基因组的数万个基因中,科学家们将名单缩减到13对左右,这些基因在不同人群中差异最大。他们利用这些配对来制作一个叫做“电泳图”的图形,在这个图形中,每一组基因产生一个特定高度的峰值。据估计,两个人拥有所有13个峰对的可能性约为400万亿分之一,是地球上人口数量的许多倍。因此,如果发现两个侧面在每个峰值都完全匹配,那么它们不太可能来自同一个人,或者来自同一对双胞胎。
然而,也可能出现这样的情况,即个人资料不完全清楚,例如,样本可能包含几个人的DNA的混合物,可能会被降解,或者可能非常小。因此,DNA匹配总是伴随着一个称为“随机匹配概率”(RMP)的概率数字提交给法庭。这意味着随机从街道上挑选的人有可能与所讨论的DNA样本相匹配。样本越不清晰,RMP越高。
把可能性带进法庭可以把明显的有罪转变为无罪的可能性。数学可以在看似不可能的事件和看似不可能的事件之间改变平衡,引入不确定性因素,可能避免“在合理怀疑之外”的定罪,正如刑事标准所要求的。它也可以纠正常识的假朋友。在阿曼达·诺克斯一案中,一名年轻的西雅图女子为自己辩护,她被控与2007年在意大利佩鲁贾镇的英国室友死亡有关法官的拒绝重新测试在菜刀上发现的受害者有争议的部分DNA,可以说是因为没有把握多个不确定的测试可以产生更确定的结果这一事实。
这样的错误太常见了,更糟糕的是,统计语言无处不在,鼓励人们认为他们很理解它,他们知道百分比的含义,他们理解概率是如何工作的。但事实上,管理不太可能发生的事情是非常棘手的,而且有许多普遍存在的误解,只要有一点数学知识就可以很容易地纠正。
统计语言无处不在,鼓励人们认为自己很了解它。
解释DNA图谱的一个重要工具是贝叶斯定理。它是一个允许条件概率推理的方程,比较给定事件状态的结果的可能性,与没有该事件状态的结果的可能性。贝叶斯可以帮助陪审员评估新证据的重要性,衡量被告无罪时出现的几率和被告有罪时出现的几率。
至关重要的是,贝叶斯理论表明DNA测试的RMP是不事实上,与获得匹配的人是DNA来源的概率相同。将这两种情况混为一谈就是一个被称为“检察官谬误”的例子:没有意识到事实上符合证据(A)是无辜的(B),而不是无辜的人从街上被抓走的概率将符合证据。用数学符号表示为P(B|A)≠P(A|B)。
这种区别在20世纪90年代英国的一个著名案例中表现出来。1991年4月6日清晨,M小姐(她后来在法庭文件中被确认)在伦敦与朋友们晚上外出后回家。一个男人走近她询问时间。当她低头看手表时,他突然从后面抓住她,把她扔到地上,强奸了她,然后逃跑了。
当M小姐向警方报告强奸案时,她能够粗略地描述袭击她的人。她说他二十出头,白种人,刮得干干净净,带着当地口音。此外,法医学家从M小姐的尸体上收集了袭击者的精液样本。这产生了一份DNA档案,最终被发现与当地一个名叫安德鲁·迪恩(Andrew Dean,化名)的男子相匹配,他的档案在一起无关的性犯罪后被添加到DNA数据库中。
Dean案件中给出的RMP为2亿分之一,这表明非常匹配。在拥有6000万人口的英国,这是可以想象的,但不太可能找到另一个具有相同DNA特征的人。但迪恩的身份证明存在一些问题。M小姐无法在警察列队中认出他。当迪安被指给她看时,她说他不可能是袭击她的人,因为他“年龄大得多”。迪安不是20多岁,但事实上,37岁。此外,他还有不在场证明,一个女朋友说她那天晚上和他在一起。
在迪恩的审判中,陪审团实际上必须权衡两种不同类型的证据:DNA比对(指向有罪)和非科学证据(指向无罪不在场证明)以及M小姐无法认出迪恩的事实。
辩方建议使用贝叶斯推理来平衡这一证据。它叫Peter Donnelly,牛津大学统计学教授,作为专家证人。他说,利用Bayes,我们可以通过将先前的犯罪几率乘以与新材料对应的“可能性比率”,来评估新证据应该如何影响犯罪可能性。似然比衡量的是被告有罪时看到证据的相对几率,而不是被告无罪时看到证据的相对几率。其计算方法如下:
(如果被告有罪,看到证据的概率)
÷
(如果被告是无辜的,看到证据的概率)
唐纳利随后分发了一份调查问卷,邀请陪审员对证据进行上述计算。他还为每位陪审团成员和法官带来了计算器,并通过一个示例进行了演示,不过他鼓励陪审团成员自己对所涉及的概率做出估计。(当他到达计算器“现在应该显示31.6的值”的点时,法官喊道,“但我的计算器显示的是零!”
在迪恩的审判中,陪审团实际上不得不权衡两种不同类型的证据:指向有罪的DNA匹配,以及指向无罪的非科学证据。
在审判开始时,唐纳利表示,无罪推定意味着他们可以假设被告并不比该地区的其他男性更有可能有罪。考虑到当地男性的数量(大约15万)和迪安是当地男性的概率(唐纳利认为大约是75%),唐纳利认为迪安犯罪的概率大约是20万分之一,或者是1 ÷(15万÷ 0.75)。
接下来,法庭上出示的每一份证据都会产生一个似然比,可以依次乘以该似然比,以便“更新”对有罪的评估。关于M小姐未能确认迪安身份的影响,唐纳利举例说明了在迪安有罪的情况下,这种失败的概率为10%(在分数的顶部),在迪安无罪的情况下,这种失败的概率为90%(在分数的底部)。这使得迪恩有罪的可能性比率为1/9。
然后,对迪恩的女朋友声称他们在一起过夜的说法进行了同样的计算,唐纳利估计有罪的被告有25%的机会援引这一证据,而无罪的被告有50%的机会援引这一证据。这使得迪恩不在场证明的可能性比为25:50,或1:2。
因此,在引入DNA证据之前,陪审员可能会估计迪恩犯罪的可能性是以下原因造成的:
(1/200000)x(1/9)x(1/2)=1/3600000,或360万分之一。
现在,计算陪审团对DNA比对的权重也可以用同样的方法。分数的顶部是DNA样本与迪恩有罪的概率,等于100%。分数的底部是迪恩无罪时匹配的概率。这是RMP测量的数字,即0.0000005%(或2亿分之一)。这一计算得出了与DNA证据相关的犯罪可能性比为2亿比1(或迪恩无罪的可能性比为2亿比1)。
所以,迪恩有罪的几率可以通过将这些证据的可能性比率相乘来计算:
(1/3,600,000) x (200000000/1)
= 200 ÷ 3.6
=55.55,或大约55比1有利于有罪。
换句话说,使用唐纳利的数据和他的贝叶斯分析,迪恩无罪的概率是55分之一,尽管他的DNA样本匹配得很好。如果陪审团只考虑2亿分之一的RMP,那么他是无辜的可能性就会大大增加。
尽管唐纳利做了证词,迪恩一案的陪审团还是投票判定有罪。然而,他的定罪在上诉后被撤销,他被送回重审,在那里他被再次定罪,他的上诉被驳回。在每种情况下,上诉法官表示不喜欢的贝叶斯方法,认为“陪审员评估证据并得出结论不仅通过一个公式,数学或否则,而是由个人的联合应用常识和知识世界的证据。”
美国和英国的法院都对让陪审团过分依赖概率专家证据持谨慎态度。他们似乎担心,数学可能会把太多的权力交给专家,并把陪审员变成机械的数字计算者,而不是感觉、推理、敏感和明智的裁判。这种怀疑主义有着悠久的传统,至少可以追溯到法学家劳伦斯部落(Laurence Tribe),他在1971年的《哈佛法律评论》(Harvard Law Review)上发表了一篇文章,名为《数学审判:“法律程序中的精确和仪式”认为,看似“无情”的数字可能“恐吓”陪审团,并侵蚀他们本打算带入决策的“社区价值观”。
法官对数学推理的不信任并不是它在法庭上使用的唯一障碍。数学家们自己还没有就贝叶斯定理的恰当形式达成一致,也没有就向陪审团解释他们的计算的最佳方式达成一致。即便如此,概率推理仍然是一种强有力的工具,它可以对抗人类直觉中关于不可能性的缺陷,为它找到合适的角色是一个急需解决的问题——尤其是在dna匹配证据被视为如此可恶,以至于它常常盖过其他一切的气候下。
Leila Schneps是巴黎儒斯尤研究所的神秘作家和数学家。Coralie Colmez是伦敦的一名数学家教。科尔梅兹是施奈尔普斯的女儿,两人都是贝叶斯和法律研究协会的成员。他们是…的作者审判中的数学:数字如何在法庭上被使用和滥用这本书于2013年出版。