法律概率(二)

应牢记这种分析的局限性。 .73比是与另一个假设相比的概率的量度。仅凭这一比率,就不能推断出单个假设的后验概率。只有当竞争的假设H和H'是独家和详尽的,例如另一个是否定的,后验概率才能从后赔率中得出

po =

p(h∣e)

p(h'∣E)

通过平等

pr(h∣e)=

po

1+po

但是假设杀戮和自然并不详尽,因为两个婴儿可能会以其他方式死亡。所以后部赔率

PR(杀死死亡)

PR(自然死亡)

不能翻译成单个假设的后验概率。 (§3.3中提出了更复杂的概率分析。)

1.4数字来自哪里?

在迄今为止考虑的示例中,根据经验频率和专家意见分配了概率。例如,只有5%的人拥有特定血型的专家证词被用来设置PR(m¬s)=。05。还根据常识分配了概率,例如,将公关(MR)设置为1,假设如果某人是犯罪痕迹的来源,则该人必须与犯罪痕迹相匹配(搁置了框架的可能性,在测试结果中制造痕迹或假阴性)。但是概率并不总是分配确切的值。实际上,同意确切的价值可能非常困难,尤其是对于先前的概率。这是法律概率主义的挑战(请参见第7.3节中的后面)。规避这一挑战的一种方法是避免设置确切的值并采用合理的间隔。该方法基于灵敏度分析,这是对先前概率如何影响其他概率的评估。

请考虑《亲子关系案例》案诉博伊德(331 N.W. 2d 480,Minn。1983)。专家证人波雷斯基博士作证说,必须从普通人群中随机选择1,121名无关的男人,然后才能与所有适当的基因一起发现另一个男人才能生育出相关的孩子。该公式可能会产生误导性,因为匹配的DNA配置文件的预期数不一定与在人群中实际发现的匹配轮廓的数量相同(否则思考的错误称为预期值谬误)。在更仔细的表述中,随机人是匹配的可能性为1/1121,或者在符号中,

pr(m∣法)=

1

1121

正如第1.2.3节中早期所述的那样,这种概率不能轻易地转化为遗传概况匹配的人是父亲或符号,pr(rafor.m)的概率。后者应使用贝叶斯定理计算:

pr(raffermm)=

PR(M.Father)×PR(父亲)

pr(m father)×pr(父亲)+pr(m not-father)×pr(非父亲)

在实际实践中,建立亲子关系的公式更为复杂(Kaiser和Seber,1983),但是为了说明,我们抽象了这种复杂性。假设被告是父亲的先前概率低于.01,或者在符号中,pr(rath)=。01。将此概率插入贝叶斯定理,以及PR(m r.father)= 1和Pr(m not-father)= 1/1,121,给出了同等的亲子症PR(rafor.m)的概率。 92。

但是,为什么要以先验的概率为.01而不是其他概率呢?灵敏度分析的想法是研究一系列合理的概率分配并研究此类选择的影响。在法律申请中,关键问题是最有利于被告的任务是否仍将对被告提出强有力的证据案件。在手头的情况下,专家证词是如此强烈,以至于对于先前的PR(父亲)的广泛概率,后概率PR(父)仍然很高,如图1所示。

谱系情况的标题为灵敏度分析:X轴标记为p(父亲),从0到1; Y轴被标记为P(父亲|匹配),从0到1。该线从0,0急剧上升到几乎0,1,然后几乎水平到1,1

图1

后验超过.9,一旦先验高于0.008。在父亲案件中,鉴于母亲的证词和其他证据,很明显,无论先前的概率应该是多少,都应考虑到专家证词之前的父亲身份的可能性高于此。如果不安装精确的值,则值高于.008的间隔将保证伴侣的后验概率至少为.9。这足以满足管理民事案件(例如亲子关系纠纷)的优势标准(根据证明标准,请参见第5节。)

1.5来源,活动和进攻水平假设

评估概率的困难与选择的假设息息相关。在某些近似过程中,假设可以分为三个级别:犯罪,活动和来源水平假设。在进攻水平上,问题是被告是否有罪,例如“史密斯犯有过失杀人罪”中的声明中。在活动级别,假设描述了发生的事情以及所涉及的事情做了或没有做什么。活动水平假设的一个例子是“史密斯刺伤了受害者”。最后,来源级别的假设描述了痕迹的来源,例如“受害者在现场离开污渍”,而没有指定痕迹如何到达那里。忽视假设水平的差异会导致严重的困惑。

考虑一种DNA匹配是主要罪名证据的情况。 DNA证据是当前可用的定量证据的最广泛使用的形式之一,但与血液证据或其他形式的痕量证据的起作用不同。在证明DNA比赛时,试验专家通常会评估一个与犯罪无关的随机人的可能性,将偶然地与犯罪污渍概况相吻合(Foreman等,2003)。这称为基因型概率或随机匹配概率,该概率可能非常低,以1亿分之一甚至更低的速度(Donnelly 1995; Kaye and Sensabaugh 2011; Wasserman 2002)。将随机匹配的概率等同于PR(m innotence)以及与先前的PR(无罪)一起使用贝叶斯定理来计算无罪PR的后验概率(Innocence.m)。这将是一个错误。

当然建议应用贝叶斯定理,这有助于避免检察官的谬误,即 Pr(innocence∣m) 和 Pr(m∣innocence) 的合并。这里的问题出在其他地方。将随机匹配概率等同于 Pr(m∣innocence) 忽略了攻击、活动和源级别假设之间的差异。 DNA 匹配不能直接说明有罪或无罪的问题。即使嫌疑人是现场遗传物质的来源,匹配也不能证明被告确实访问了现场并与受害人接触过,即使他们这样做了,也不能推断他们实施了犯罪他们被指控。

很少有证据可以直接证明犯罪级别的假设。更适合概率量化的环境证据,例如 DNA 匹配和其他痕迹证据,则不然。目击者证词可能更直接地说明犯罪级别的假设,但它也不太容易进行概率量化(但请参见 Friedman 1987、Wixted 和 Wells 2017 的最新结果以及 Urbaniak 等人 2020 对相关问题的调查)。这使得很难为犯罪级别假设分配概率。超越源层面的假设需要科学家、研究人员和律师之间的密切合作(参见 Cook 等人 1998 年的讨论)。

2. 证据的强度

给定证据的假设的后验概率不应与支持该假设的证据的强度(或证明值、权重)相混淆。一项证据的强度反映了它对假设概率的影响。假设 H 的先验概率极低,例如 Pr(H)=.001,但考虑到证据 E,该概率高达 35%,即 Pr(H∣E)=.35。这是一个戏剧性的向上转变。尽管给定 E 的 H 的后验概率并不高,但 E 强烈支持 H。本节将研究概率论如何帮助评估证据的强度。

2.1 贝叶斯因子与似然比

证据强度的概念——与先验概率和后验概率不同——可以通过多种不同的方式来正式捕获(有关全面的讨论,请参阅确认理论的条目)。衡量证据强度的一种方法是贝叶斯因子

Pr(E∣H)

Pr(E)

(已在第 1.2.3 节中讨论)。这是一种直观上合理的证据强度衡量标准。请注意,根据贝叶斯定理

Pr(H∣E)=贝叶斯因子(H,E)×Pr(H),

因此,当且仅当后验概率 Pr(H∣E) 高于先验概率 Pr(H) 时,贝叶斯因子才大于 1。贝叶斯因子越大(对于大于 1 的值),从先验概率到后验概率的向上偏移越大,E 对 H 的正向支持就越强。相反,贝叶斯因子越小(对于小于 1 的值),向下偏移越大从先验概率到后验概率,E 越强烈地负面支持 H。如果 Pr(H)=Pr(H∣E),则证据对 H 的先验概率没有向上或向下的影响。

贝叶斯因子是证据 E 对 H 支持的绝对度量,因为它将假设 H 下 E 的概率与一般 E 的概率进行比较。分母按照总概率定律计算:

Pr(E)=Pr(E∣H)Pr(H)+Pr(E∣ØH)Pr(ØH)。

包罗万象的替代假设 ØH 可以被一组更细粒度的替代假设所取代,例如 H1,H2,…Hk,前提是 H 及其替代假设覆盖了整个可能性空间。全概率定律则为:

Pr(E)=Pr(E∣H)Pr(H)+

k

Σ

我 = 1

Pr(E∣Hi)Pr(Hi)。

证据的强度可以通过似然比来评估,而不是贝叶斯因子,这是一种比较衡量证据 E 是否比竞争假设 H' 更支持假设 H 的方法,以符号表示,

Pr(E∣H)

Pr(E∣H′)

例如,一位专家可能会证明,如果夹克的穿着者击中了受害者(假设 H),则被告夹克上的血迹被看到的可能性是如果夹克的穿着者没有击中受害者(假设 H′)的十倍。 )(艾特肯、罗伯茨和杰克逊 2010 年,38)。如果证据支持 H 多于 H',则该比率将高于 1,如果证据支持 H' 多于 H,则该比率将低于 1。似然比越大(对于大于 1 的值),与 H' 相比,支持 H 的证据就越有力。似然比越小(对于低于 1 的值),与 H 相比,支持竞争假设 H′ 的证据就越有力。

似然比之间的关系

Pr(E∣H)

Pr(E∣H′)

和后验赔率

Pr(H∣E)

Pr(H′∣E)

在贝叶斯定理的赔率版本中很明显(参见前面的§1.3)。如果似然比大于(小于)1,则 H 的后验概率将大于(小于)先验概率。因此,似然比是衡量证据对概率的向上或向下影响的指标。两个假设 H 和 H′。

似然比作为衡量证据强度的一个竞争对手是一个更简单的概念,即概率 Pr(E∣H)。人们很容易认为,只要 Pr(E∣H) 较低,E 就应该是反对 H 的有力证据。考虑 Triggs 和 Buckleton (2014) 的一个例子。在虐待儿童案件中,检察官提供的证据表明,一对夫妇的孩子会晃动(一种运动模式),而只有 3% 的非受虐儿童会晃动,Pr(儿童晃动∣无虐待)=.03。如果一个未受虐待的孩子不太可能摇晃,那么这个孩子摇晃的事实可能会成为虐待的有力证据。但这种对 3% 数字的解读是错误的。很可能有 3% 的受虐待儿童摇滚,Pr(儿童摇滚∣滥用)=.03。如果在任一假设下都不太可能发生摇摆——这意味着似然比

Pr(儿童摇滚∣滥用)

Pr(儿童摇滚∣无虐待)

等于一——摇摆不能算作虐待的证据。为了避免夸大证据,最好通过似然比而不是给定假设的证据概率来评估证据(ENFSI 2015;Royall 1997)。

2.2 冷击DNA匹配

为了更好地理解似然比,将 DNA 证据作为案例研究,特别关注冷击匹配是有启发性的。 DNA 证据可用于证实案件中的其他证据或作为主要定罪证据。假设不同的调查线索都指向一个人,马克·史密斯,是肇事者。假设调查人员还在犯罪现场发现了犯罪者留下的几条痕迹,并且实验室分析表明与这些痕迹相关的基因图谱与史密斯相匹配。在这种情况下,DNA 匹配证实了对史密斯不利的其他证据。相反,假设没有任何调查线索让警方能够识别嫌疑人。唯一的证据是在犯罪现场发现的痕迹。警方通过档案数据库运行与痕迹相关的基因档案,并找到匹配项,即所谓的冷击。由于在冷击案件中没有其他证据,冷击火柴是对被告不利的主要证据。一些学者认为这种情况削弱了比赛的证据价值。其他人不同意。现在我们来审视这场争论中的一些主要论点。

2.2.1 随机匹配与数据库匹配

假设一位专家证明犯罪痕迹与被告基因匹配,并且随机匹配的概率极低,比如一亿分之一。随机匹配概率(通常被解释为非来源的某人巧合匹配的概率,Pr(m∣Øs))是 DNA 匹配强度的常用衡量标准。这个概率越低,比赛的罪名就越强烈。严格来说,只有当似然比满足时,匹配才是被告是来源的有力证据

Pr(DNA 匹配∣s)

Pr(DNA 匹配∣Øs)

显着大于一。然而,在实践中,当随机匹配概率较低时(即 Pr(m∣Øs) 较低),似然比应显着高于 1,因为作为源的个体匹配的概率 Pr(m ∣s),只要测试的假阴性率较低,就应该很高。那么,出于实际目的,低随机匹配概率确实可以算作强有力的定罪证据。

然而,当涉及到冷场比赛时,就会出现进一步的复杂情况。帕克特的案例可以作为例证。 2008 年,通过对 338,000 份个人资料的数据库搜索,约翰·帕克特 (John Puckett) 的身份被确定。他是数据库中唯一与 1972 年强奸受害者戴安娜·西尔维斯特 (Diana Sylvester) 收集的痕迹相匹配的个人。专家证人证明,帕克特的基因图谱应该在白人男性中随机出现,频率为 110 万分之一。这似乎有力地证明了帕克特的清白。但辩方 DNA 专家比卡·巴洛 (Bicka Barlow) 指出,除了冷战之外,对帕克特不利的证据很少。巴洛认为,对冷战比赛的正确评估需要将数据库的大小乘以 1/1100 万。将该乘法的结果称为数据库匹配概率。将 1/1.1 百万乘以 338,000 会得到大约 1/3 的数据库匹配概率,这是一个不起眼的数字。如果数据库中的某人能够以 1/3 的概率进行匹配,那么冷击匹配不应算作针对 Puckett 的有力证据。这是巴洛的论点。

巴洛遵循了国家研究委员会 1996 年的一份报告,该委员会通常被称为 NRC II(国家研究委员会 1996)。该报告建议,在冷灾情况下,随机匹配概率应乘以数据库的大小。此更正旨在防止数据库中无辜者错误匹配的风险增加。 NRC II 使用了一个类比。如果你同时扔几枚不同的硬币,并且第一次尝试时所有硬币都正面朝上,那么这个结果似乎有力地证明了硬币存在偏差。然而,如果你多次重复这个实验,几乎可以肯定,在某个时刻所有硬币都会正面朝上。这一结果不应被视为代币存在偏见的证据。根据 NRC II 的说法,多次重复抛硬币实验类似于尝试通过搜索配置文件数据库来找到匹配项。随着数据库规模的增加,数据库中与犯罪无关的人更有可能匹配。

这个类比的恰当性受到了质疑(Donnelly 和 Friedman 1999)。搜索更大的数据库无疑会增加在某个时刻找到匹配项的可能性。但这里的相关命题并不是“数据库中至少有一个配置文件会随机匹配犯罪样本”。相反,相关命题是“受审被告的个人资料将与犯罪样本随机匹配”。由于对数据库中的其他人进行了测试,因此在被告和犯罪样本之间找到匹配的概率不会增加。事实上,假设世界上的每个人都记录在数据库中。一场独特的冷击比赛将成为极其有力的犯罪证据,因为除了一个匹配的个人之外,每个人都将被排除在嫌疑人之外。相反,如果将随机匹配概率乘以数据库的大小,则匹配的证明值应该相当低。这是违反直觉的。

另一个类比有时被用来争论冷战比赛的证据价值应该被削弱。这个类比是在数据库中搜索匹配和多重假设检验(一种令人反感的研究实践)。在经典假设检验中,如果假设的单次检验中出现类型 I 错误的概率为 0.05,则通过多次检验同一假设,该概率将会增加。该观点认为,数据库匹配概率将纠正 I 类错误风险增加的情况。然而,正如 Balding (2002, 2005) 指出的,多重检验在于根据新证据多次检验同一假设。在冷灾案例中,多个假设(每个假设都涉及数据库中的不同个体)仅测试一次,如果出现负匹配则将其排除。从这个角度来看,被告是消息来源的假设是众多需要检验的假设之一。冷场比赛支持了这一假设并排除了其他假设。

2.2.2 冷击匹配的似然比

评估冷击比赛的更原则性方法是基于似然比。该提议借鉴了 Eggleston (1978)、Dawid (1994) 以及 Dawid 和 Mortera (1996) 研究的关于所谓岛屿问题的文献。设检方假设Hp为“犯罪嫌疑人是犯罪痕迹的来源”,辩护假设Hd为“犯罪嫌疑人不是犯罪痕迹的来源”。设M为犯罪污点与犯罪嫌疑人(包含在数据库中)之间的DNA匹配,D为数据库中除犯罪嫌疑人以外的个人资料中没有人与犯罪污点匹配的信息。与 M 和 D 相关的似然比应为(Balding 和 Donnelly 1996;Taroni 等人 2014):

V=

Pr(M,D∣Hp)

Pr(M,D∣Hd)

由于 Pr(A∧B)=Pr(A∣B)×Pr(B),对于任何语句 A 和 B,该比率可以写为

V=

Pr(M∣Hp,D)

Pr(M∣Hd,D)

×

Pr(D∣Hp)

Pr(D∣Hd)

第一个比例

Pr(M∣Hp,D)

Pr(M∣Hd,D)

大约为 1/γ,其中 γ 是随机匹配概率。第二个比例

Pr(D∣Hp)

Pr(D∣Hd)

是数据库搜索率,定义如下(详细信息参见 Balding and Donnelly 1996;Taroni et al. 2014):

Pr(D∣Hp)

Pr(D∣Hd)

=

1

1−φ

,,,,

其中Pr(S∣Hd)=φ,S代表数据库中的某人是犯罪痕迹的来源的命题。 Donnelly 和 Friedman (1999) 为这个比率导出了一个类似的公式。随着数据库变大,φ增加,数据库搜索率增加。仅当数据库中没有人可以作为源时,该比率才等于 1。

(本章完)

相关推荐