法律概率(三)
由于冷击匹配的似然比 V 是由 DNA 匹配的似然比与数据库搜索比相乘得出的,因此 V 将始终大于匹配的单纯似然比(除了不切实际的情况,即 φ=因此,冷击 DNA 匹配应该被视为比先前识别的嫌疑人的 DNA 匹配更有力的证据,Dawid 和 Mortera (1996) 研究了不同的数据库搜索策略,并考虑了有关匹配的信息本身不确定的可能性,但是在合理的假设下,忽略数据库搜索将对冷击比赛的证据强度进行保守评估。
基于冷击比赛的信念存在直观的阻力,但在普通比赛的情况下,这种阻力不那么强烈(稍后将在第 6 节中对此进行详细介绍)。这种对基于普通 DNA 匹配的定罪的偏好似乎与“冷击匹配比普通匹配更有力的犯罪证据”这一说法存在冲突。然而,有一种方法可以调和双方。关键是要记住,证据强度(通过似然比衡量)不应与给定证据的有罪后验概率相混淆。如果冷击匹配是唯一的有罪证据,那么与其他证据(例如调查线索)补充 DNA 匹配的案件相比,有罪的后验概率可能会更低。尽管冷击匹配的证明价值更强,但这种较低的后验概率证明了对冷击案件定罪的直觉抵制是合理的。
2.3 选择竞争假设
正如前面关于冷战比赛的讨论所示,似然比有助于评估证据的强度。然而,一个主要困难是选择要比较的假设 H 和 H'。这些假设应该相互竞争——比如,在刑事审判中,H是控方提出的假设,H'是辩方提出的假设。但这一限制为操纵和误解证据留下了可能性。让我们来看看有关该主题的文献中的一些主要争议。
2.3.1 特别假设和巴里·乔治
再考虑一个程式化的 DNA 证据案例。假设检察官提出假设,嫌疑人留下了在犯罪现场发现的痕迹。这一假设得到了实验室分析的充分支持,显示被告的基因与这些痕迹相匹配。然而,辩方对此作出回应,提出了以下临时假设:“犯罪污点是由某个与嫌疑人基因型相同的身份不明的人留下的”。由于给定任一假设的 DNA 匹配概率为 1,因此似然比等于 1 (Evett, Jackson, and Lambert 2000)。问题具有普遍性。对于任何证据项和任何给定的检察官假设 H,都存在一个临时竞争假设 H*,使得
Pr(E∣H)
Pr(E∣H*)
= 1。
假设 H* 是一个恰如其分的假设,之所以被选择,只是因为它与假设 H 一样解释了证据(Mayo 2018:30-55)。如果不对竞争假设的选择施加进一步的限制——似乎——没有证据可以证明被告有罪。
法官和陪审员通常会认识到临时假设的本质——不应该认真对待的人为理论。也许,试验参与者的常识足以以正确的方式限制假设的选择。但真实的案例是复杂的,而且选择相互竞争的假设(这些假设显然不是临时的)是否合法并不总是显而易见的。
一个著名的例子是 R. v. George(2007 EWCA Crim 2722)。巴里·乔治被指控谋杀英国记者兼电视名人吉尔·丹多。一年后,在乔治的外套口袋里发现了一粒枪支残留物,它与犯罪现场的残留物相符。这是对他不利的关键证据。乔治被定罪,他的第一次上诉没有成功。第一次上诉后,法医科学服务处的伊恩·埃维特 (Ian Evett) 担心证据在审判时没有得到适当评估。鉴于辩护假设乔治没有开枪,陪审员被告知在乔治的外套中发现枪支残留物的条件概率。这个概率估计是相当低的。但鉴于检察官假设乔治确实开枪射杀了丹多,陪审员并没有获得找到相同证据的条件概率。专家证人 Keeley 先生被要求提供两个条件概率,并估计它们为 1/100,这表明枪支残留物没有证明价值。 2007年,乔治再次上诉,依靠基利的估计,赢得了上诉。
对试验记录的研究表明,基利对假设的选择缺乏连贯性,因此基于这些假设的似然比毫无意义。有一次,基利比较了乔治口袋里发现的粒子来自乔治本人开枪的假设和粒子来自其他来源的另一种假设。还有一次,基利认为检察官的假设是“乔治口袋里发现的颗粒来自杀死丹多的枪”。但给出这个假设的证据的条件概率应该不低。其实应该是一个。对审判笔录最仁慈的解读表明,专家考虑了“乔治是射杀丹多的人”和“乔治外套的完整性被破坏”的假设。但 Keeley 没有给出为什么应该在似然比上比较这些假设的理由(详细信息请参见 Fenton et al. 2014)。
一个相关的复杂性是,相互竞争的假设可能涉及任何事实争议,从微小的细节(例如用于窒息受害者的布是红色还是蓝色)到最终的问题(例如被告是否刺伤了受害者)。似然比因在不同粒度级别制定的假设而异:攻击、活动和源级别假设(关于这一区别,请参阅前面的§1.5)。甚至有可能,在源层面,似然比有利于一方,如控方所说,但在进攻层面,似然比有利于另一方,如辩方,即使这两个层面的假设相当类似(Fenton 等人,2014 年)。
2.3.2 排他性和详尽性?
巴里·乔治案中的混乱是由于在似然比中选择假设时缺乏明确的规则。其中一条规则可能是:选择排他性(它们不能同时为真)和详尽(它们不能同时为假)的竞争假设。这样,各方就无法选择临时假设并使对证据的评估偏向于对自己有利的方向。
还有其他充分的理由说明似然比中的假设应该是排他性的和详尽的。因为如果不是,似然比可能会产生违反直觉的结果。要了解原因,首先考虑不相互排斥的假设。让 Hp 代表“被告有罪”,Hd 代表“被告不在犯罪现场”。设E代表
犯罪发生前十分钟,在不同地点看到的被告在电话中无意中听到,说“去吧,杀了他”。
证据积极支持每个假设,但可以想象,在这种情况下,似然比应等于 1。此外,考虑两个并非详尽无遗的相互竞争的假设。假设弗雷德和比尔试图抢劫一个人。受害人反抗,头部被击中身亡。假设 Hp 代表“弗雷德击中了致命一击”,Hd 代表“比尔击中了致命一击”。这些假设并不详尽,因为第三个假设是“该男子并未死于打击”。假设E是受害者六个月前心脏病发作的信息。似然比
Pr(E∣Hp)
Pr(E∣Hd)
等于一,因为
Pr(E∣Hp)=Pr(E∣Hd)。
然而 E 降低了 Hp 和 Hd 的概率。因此,在这种情况下,证据否定地支持每个假设,这与似然比所表明的相反。
但依赖排他且详尽的假设也并非没有并发症。考虑一位专家决定通过否定起诉假设来制定辩护假设,例如“被告没有击中受害者的头部”。这种防御假设的选择可能无助于评估证据。如果犯罪嫌疑人没有击中受害人的头部,那么他身上有这样那样的血迹的概率是多少?这取决于他是否在场、当时在做什么以及许多其他情况。正如 Evett、Jackson 和 Lambert(2000)所指出的,用于评估证据强度的特定假设的选择将取决于背景因素。通常,所选择的假设不会相互排斥。比较排他性和详尽的假设对于陪审员或法官在审判中做出决定也没有帮助。例如,在亲子鉴定案件中,专家不应该比较假设“被告是孩子的父亲”及其否定,而应该比较“被告是孩子的父亲”和“孩子的父亲是”一个与假定的父亲无关的人”(Biedermann et al. 2014)。即使被告的亲属是潜在的父亲,考虑到这种牵强的可能性也会使证据的评估变得比需要的更加困难(Evett et al. 2000)。
排他性和详尽的假设可以防止任意比较,并确保对证据进行更有原则的评估。缺点是这样的假设涵盖了整个可能性空间,并且筛选这个空间在认知上是不可行的(Allen 2017)。在这方面,比较更受限制的假设是更好的选择。然而,这样做的危险在于似然比在很大程度上取决于所比较的假设。假设选择的自由度越大,作为证据价值衡量标准的似然比的可变性就越大。
2.4 双染问题
进一步说明似然比作为证据强度衡量标准的局限性的案例研究是双污点问题,最初由 Evett (1987) 提出。
在埃维特最初的表述中,犯罪现场留下了来自两个不同来源的两处污迹,嫌疑人的血液与其中之一相匹配。第一个假设是嫌疑人是犯罪的两个人之一,第二个假设是对第一个假设的否定。 Evett (1987) 表明(详细信息请参阅他的论文)相对于这两个假设的匹配的似然比是 1/2q1,其中 q1 是第一个染色特征的估计频率。令人惊讶的是,似然比并不取决于与第二染色相关的频率。
现在考虑一个更复杂的双染色场景。假设犯罪是由两个人实施的,他们在犯罪现场留下了两个污点:一个在枕头上,另一个在床单上。因其他原因被捕的约翰·史密斯(John Smith)在基因上与枕头上的 DNA 相匹配,但与床单上的 DNA 不匹配。 Meester 和 Sjerps(2004)认为,存在三对与数值上不同的似然比相关的看似合理的假设(详细信息请参阅他们的论文)。表 2 列出了这三个选项,其中 R 是史密斯基因图谱的随机匹配概率,δ 是史密斯是犯罪现场捐赠者之一的先验概率。
表2
惠普高清LR
史密斯是犯罪现场捐赠者之一。史密斯不是犯罪现场捐赠者之一。
r
2
史密斯是枕头污渍的捐赠者。史密斯不是犯罪现场捐赠者之一。r
史密斯是枕头污渍的捐赠者。史密斯不是枕头污渍捐赠者。
R(2−δ)
2(1−δ)
尽管似然比在数值上不同,但在给定证据的情况下,它们的后验概率是相同的。请注意,表中三个 Hp 的先验赔率应以 δ 表示。根据(Meester 和 Sjerps 2004),表中第一个假设的先验赔率是 δ/(1−δ)。第二个假设的先验赔率是 (δ/2)/(1−δ)。第三个假设的先验赔率是 (δ/2)/(1−(δ/2))。在每种情况下,后验赔率(先验赔率乘以似然比的结果)都是相同的:R×δ/(2(1−δ))。因此,尽管似然比存在差异,但只要先验适当相关,不同假设的后验概率是相同的。
Meester 和 Sjerps (2004) 建议每个似然比都应该附有一个表格说明,说明先验赔率(或先验概率)的选择将如何影响后验赔率,对于合理的先验范围(用于对此策略的一般讨论) ,称为“敏感性分析”,请参阅第 1.4 节中的先前讨论)。通过这种方式,无论选择何种假设,似然比的影响都是显而易见的。该策略承认似然比信息不足,应将其与其他信息(例如一系列先验)结合起来,以便对证据进行充分评估。
3. 贝叶斯网络的法律应用
到目前为止,我们研究了概率论如何帮助评估单个证据,例如 DNA 匹配。但事情往往更复杂。在法律案件中,不同的证据可能会趋同,例如两名证人证明被告在犯罪现场被看见,也可能出现分歧,例如一名证人声称在犯罪现场看到被告,而 DNA 测试显示被告曾在犯罪现场被看见。被告与现场之间没有基因匹配。复杂性的另一个来源是当事人在审判中提出的假设通常是复杂的陈述结构。如何将不同的陈述及其支持证据结合起来并评估整个检察官的案件(或辩方的案件)?
原则上,可以通过连续应用贝叶斯定理来评估给定多个证据的假设的概率。例如,考虑一个案件,被告面临两项罪证:DNA 匹配和现场发现的与被告头发颜色相匹配的头发证据。假设——正如人们经常做的那样——某人的头发颜色与某人的基因特征无关。假设头发证据的似然比为 40,DNA 匹配的似然比为 200,也就是说,在有罪假设下找到证据的可能性比无罪假设高 40 倍(200 倍)。如果有罪与无罪的先验概率为 1/1000,则后验概率为 1/1000×40×200=8。
这些计算很简单,但在更现实的情况下,会出现复杂化。审判中的当事人经常会提出一些零散的主张,需要将这些主张结合在一起才能形成对所发生事件的理论。例如,检察官可能会提供目击者证词来证明被告逃离犯罪现场,并提供文件证据作为动机证明。不同的零散主张,每一个都有不同的证据支持,必须结合起来形成关于所发生事件的结构化假设。由于不同的主张和不同的证据可能相互依赖,直接计算很快就会变得难以管理。幸运的是,有一个工具可以使任务变得更容易:贝叶斯网络。本节确定了在复杂的证据和假设的呈现、聚合和评估中部署贝叶斯网络的指南。
3.1 贝叶斯网络的救援
贝叶斯网络可用于法律事实调查中的概率推理的想法在八十年代末(Friedman 1986)和九十年代初(Edwards 1991)开始受到关注。最近关于该主题的两本强调法律应用的书籍是 Fenton and Neil 2013 [2018] 和 Taroni 等人。 2014. 贝叶斯网络由两个部分组成:首先,变量(由节点表示)之间的依赖关系(由箭头表示)的有向无环图;第二,条件概率表。首先考虑图形组件。该图是非循环的,因为连接节点的箭头不形成循环。作为插图,让H成为嫌疑人犯有谋杀案的声称,BT BT BT的存在与犯罪现场染色相匹配,并且目击者在犯罪时期观察到现场附近的嫌疑人的事实。贝叶斯网络的图形组件看起来像这样:
三个圆圈标记为“ H”,“ Bt”和“ W”;箭头从“ h”到“ bt”和“ w”
图2
节点X的祖先是所有节点,我们可以从中遵循箭头来到x。节点X的父母是我们可以一步做到这一点的。 X的后代全是可以从X到达的所有箭头。孩子们是我们可以一步一步做到这一点的孩子。在示例中,H是W和BT的父母(和祖先),它是其子女(和后代)。没有非父母祖先或非孩子的后代。
由节点表示并通过箭头连接的变量与概率依赖性有关。为了描述这些关系,图形模型伴随着条件概率表。对于诸如H之类的无父节点,表格指定其所有可能状态的先前概率。假设H代表二进制随机变量,具有两个可能的状态,则先前的概率可能是:
表3
事先的
h =凶手.01
h = not.murderer .99
H =凶手的.01数字基于这样的假设,即没有任何有罪的证据,被告不太可能有罪。对于儿童节点,表格指定了父母州的组合。如果变量是二进制的,则可能是:
表4
h =凶手h = not.murderer
W = SEED .7 .4
w = not.seen .3 .6
表5
h =凶手h = not.murderer
BT =匹配1 .063
BT = No.Match 0 .937
根据上面的表格,即使被告不是罪魁祸首,目击者的证词仍然会以0.4的概率使他罪名,而血液证据的可能性仅为0.063。血型频率估计是现实的(Lucy 2013:141),目击者鉴定的条件概率也是如此。不出所料,认为目击者的证词被认为不如血液匹配证据值得信赖(但有关评估目击者证词的并发症,请参见Wixted and Wells 2017; Urbaniak等,2020)。
上面的三个概率表是定义概率分布所需的。表不指定与儿童/父级关系的节点之间的概率依赖性,例如BT和W。由于它们之间没有箭头,因此假定节点BT和W是在H上是独立的,也就是说。 pr(w h)= pr(wh∧bt)。作为网络结构的一部分,这一事实代表了目击者证词和血液证据之间的独立性。这一事实的概括是所谓的马尔可夫条件(请参阅Neapolitan [2004]的教科书和人工智能条目的贝叶斯网络上的补充。)
虽然上面的贝叶斯网络(在概率表中都构成了定向的无环图,这是简单的,但对假设的概率进行了正确的直观评估,但鉴于证据的概率已经具有挑战性。尝试猜测被告犯有以下证据状态的谋杀案(H =凶手)的可能性:
犯罪嫌疑人的血型与犯罪污点相匹配,但有关证人的信息不可用。
犯罪嫌疑人的血型与犯罪污点相匹配,但目击者说,他们没有在犯罪现场附近看到嫌疑人。
犯罪嫌疑人的血型与犯罪污点相匹配,目击者说他们在犯罪现场附近看到了嫌疑人。
在这种复杂性的水平上,手动计算变得繁琐。相比之下,贝叶斯网络的软件(例如,参见Marco Scutari开发的R软件包Bnlearn和Scutari and Denis 2015中描述的B件)将很容易给出以下结果:
表6
h =凶手
bt =匹配,w =?.138
bt =匹配,w = not.seen .074
bt =匹配,w =看到.219
也许令人惊讶的是,即使这两个证据都在犯罪时,H =凶手的后验概率也约为.22(BT = Match,W = See)。
3.2成语
在对证据和假设之间的关系进行建模时,经常使用简单的图形模式(称为成语)。可以通过模块化方式组合这些基本模式来构建复杂的图形模型。在(Neil,Fenton和Nielson 2000; Hepler,Dawid和Leucari 2007)中讨论了构建贝叶斯网络的一般方法,并在(Fenton,Neil和Lagnado 2013)中讨论了一般的成语。下面说明了一些基本习语。
证据成语是假设与证据之间关系的最基本图形表示:
两个标记为“假设”和“证据”和箭头的圈子从第一个到第二个圆圈。
图3
该指示图表明,影响方向 - 可以但不需要解释为因果影响 - 从假设到证据(尽管概率依赖性是双向的)。假设节点和证据节点可以是二进制变量,例如“被告是犯罪现场痕迹的来源”(假设)和“被告在遗传上与犯罪痕迹相匹配”(证据)。但是变量不必是二进制。假设节点可能从1-40的范围(例如枪支射击的米距离)中取值,证据节点可能是代表枪支射击残基密度的连续变量(Taroni等人,2014年)。
一个更复杂的习语,称为证据准确性成语,由两个进入证据节点的箭头组成(Bovens and Hartmann 2004; Fenton,Neil,Neil和Lagnado 2013)。一个传入的箭头来自假设节点,另一个来自精度节点。这个成语可用于建模,例如,酒精测试:
三个节点标记为“证据准确性”,“过度酒精水平”和“证据过多”。箭头从前两个到第三个箭头。