法律概率(六)
尽管最初的悖论与责任的后验概率有关,但戴维德认为,似然比不会出现该悖论。 Garbolino (2014) 还建议改用似然比。然而,当相对于复合假设(例如 A∧B)评估证据项(例如 a 和 b)时,似然比的合取悖论仍然会出现。假设a和b分别为A和B提供正支持。 Urbaniak (2019) 表明,组合似然比
Pr(a∧b∣A∧B)
Pr(a∧b∣Ø(A∧B))
可能低于个体似然比
Pr(a∣A)
Pr(a∣-A)
和
Pr(b∣B)
Pr(b∣b)
。
Cheng (2012) 为合取悖论提供了另一种基于概率的解决方案。他认为,民事案件的证明标准应该要求原告的假设在证据上比被告的假设更有可能。因此,在给定案件总体证据的情况下 A∧B 的概率应与给定相同证据的替代假设的概率进行比较。需要考虑的替代方案如下:
A∧B,
ØA∧B,并且
ØA∧ØB。
在适当的假设下,如果 A 和 B 分别得到证据支持,这些替代方案的概率将低于 A∧B 的概率。因此,每当单独的主张 A 和 B 满足证明标准时,复合主张 A∧B 也应该满足证明标准。 Kaplow (2014) 提出了类似的论点。 Urbaniak(2019)指出,Cheng将防御假设分为三个子情况,A∧ØB、ØA∧B和ØA∧ØB,但没有考虑替代方案Ø(A∧B)。 Ø(A∧B)的概率实际上可能超过A∧B的概率。如果 Ø(A∧B) 是备择假设,则即使单个主张 A 和 B 满足标准,复合主张 A∧B 也可能不满足标准(对于 Cheng 方法的另一个批评,请参阅 Allen & Stein 2013)。
最后,法律概率学家可以采取整体方法来应对合取悖论。这一解决方案得到了法律概率论反对者的辩护(Allen 1986;Allen 和 Pardo 2019),但也可以被法律概率论者采用。整体方法建议根据所有可用证据评估总体复合主张(例如 A∧B)的概率,而不是评估给定个别证据的个别主张的后验概率(Hedden 和 Colyvan,2019 年;但请参阅艾伦的回应,2020)。贝叶斯网络(参见第 3 节前面的讨论)可以帮助整体评估证据(de Zoete、Sjerps 和 Meester,2017 年;de Zoete 和 Sjerps,2018 年;Neil 等人,2019 年)。
7.2 科恩的其他反对意见
Cohen (1977) 对法律概率论提出了其他一些反对意见。它们不如赤裸裸的统计证据悖论或合取悖论那么出名,但仍然值得研究。
7.2.1 完整性
命题 Pr(ØH∣E)=1−Pr(H∣E) 是概率演算的定理。如果给定 E 的 H 概率较低,则给定相同证据的 ØH 概率一定较高。这一事实似乎是出于无知而创造的证据。如果 E 是 H 的微弱证据(即 Pr(H∣E) 较低),那么它必定是 H 否定的有力证据(即 Pr(ØH∣E) 较高)。这似乎是错误的。直观上,一些证据可以微弱地支持一个假设及其否定。例如,假设有人听到谣言称被告犯罪时在酒吧过夜。该谣言不足以证明被告在酒吧过夜的说法。这并不意味着该谣言是被告没有在酒吧过夜的有力证据。证据实际上可能与假设没有任何关系。概率似乎无法捕捉到这个事实,或者至少这是反对意见。
这一困难促使 Dempster (1968) 和 Shafer (1976) 发展了非经典概率理论和证据支持。然而,法律概率学家不必拒绝经典概率论。他们可以回答说,刚刚描述的困难的出现只是因为人们倾向于用后验概率 Pr(H∣E) 来衡量证据的强度,而不是通过似然比来衡量(关于这一区别,请参见前面的章节) 2)。如果E弱支持H——即似然比
Pr(E∣H)
Pr(E∣ØH)
仅仅高于 1——这并不意味着 E 强烈支持 ØH。事实上,E 弱地不利于 ØH,因为
Pr(E∣ØH)
Pr(E∣H)
将略低于一。
7.2.2 佐证
当两个或两个以上的独立证人证明同一命题的真实性,并且他们的故事相对不太可能时,有关命题的概率应该会显着增加。这种“信心增强”的现象被称为佐证。在有间接证据的情况下,类似的现象称为趋同。 Cohen (1977) 认为没有证据支持的概率度量能够捕捉到这种现象。他研究了不同的概率建议——布尔公式(Boole 1857)、埃克洛夫原理(Ekelöf 1964)、兰伯特和克鲁斯卡尔(Lambert and Kruskal)(1988)提出的公式——并发现它们是不够的。他认为,这些提议都没有充分体现出通过证实所预期的信心提升。
最近,已经开发出更好的佐证概率解释(Fenton 和 Neil 2013 [2018];Robertson、Vignaux 和 Berger 2016;Taroni 等人 2014)。这一领域的一个反复出现的主题是,可以通过乘以各个证据的似然比来用概率术语来解释佐证。我们的想法是,不同证据组合的似然比相乘的结果超过了与各个证据相关的似然比(参见 Bovens 和 Hartmann 2004 年的一般讨论:第 5 章)。然而,科恩坚持认为,由于佐证而产生的置信度提升应该很大,而这种巨大的提升并不能反映为乘以似然比的结果。需要进一步探讨的是信心提升的大小以及影响提升的证据的特征。 Urbaniak 和 Janda(2020)详细讨论了科恩的反对意见和候选解决方案。
7.3 先验问题
另一个经常针对法律概率论的反对意见是先验问题。当人们在给定可用证据 Pr(H∣E) 的情况下开始评估假设的后验概率时,就会出现这个问题。
为了进行计算,贝叶斯定理需要以假设的先验概率 Pr(H) 作为起点,而不管证据如何。对先验概率的正确评估绝不是显而易见的。已经提出了不同的策略。
首先,先验概率可以等于 1/k,其中 k 是替代等概率假设的数量。如果有 k 个可能的假设,并且没有一个比另一个更有可能,那么很自然地为每个假设分配 1/k。然而,这种方法会使先验概率对假设的选择非常敏感,因此可能具有任意性。此外,这种方式特别不适合刑事案件。如果有两个假设“被告有罪”和“被告无罪”,则每个假设的先验概率均为 50%。然而,刑事案件中的被告在被证明有罪之前应被推定为无罪。 0.5 水平的先验犯罪概率似乎过高。无罪推定——许多国家向所有被告提供的程序性保护——应该要求将有罪先验概率设置为较小的值(Allen 等,1995)。但目前还不清楚这个值应该有多低。 0.001 足够低还是应该为 0.000001?也许可以说的是,在刑事案件中,有罪的先验概率应该极低(Friedman 2000)。
或者,先验概率可以等于 1/n,其中 n 是在审判中可能犯有犯罪或民事错误的嫌疑人或不法行为者的总数。这也是一个看似合理的提议。由于肯定有人犯了错误,如果没有任何进一步的证据,任何人都可能犯了错误,所以 1/n 是一个合理的起点。但这个提议也很快遇到了困难。在某些情况下,是否有人犯了错误本身就存在争议。或者可能存在这样的情况:确实犯有非法行为并且被告参与了该行为,但不清楚具体是什么非法行为,例如谋杀或过失杀人。
为了避免上述一些困难,其他模型依赖于相关的背景信息,例如有关人们犯罪机会的地理信息(Fenton et al. 2019)。但即使这些模型成功地对先验概率进行了明智的评估,更深层次的困难仍然存在。也就是说,任何对先验概率的评估,无论如何进行,都可能违反审判系统现有的规范性要求(Dahlman 2017;Engel 2012;Schweizer 2013)。如果对先验概率的评估依赖于人口统计信息,那么属于某些人口统计群体的人将被认为比其他人有更高的犯错误的先验概率。但是,如果某些人的先验高于其他人的先验,那么对那些被分配较高先验的人定罪或追究责任就会更容易,即使对他们不利的证据与对那些被分配较低先验的人的证据相同。这种结果可以被视为不公平,尤其是在刑事案件中,因为它使那些因其所属人口群体而被分配更高先验概率的无辜者面临更高的定罪风险(Di Bello and O’Neil 2020)。
也许,正如一些人所建议的那样,法律概率学家应该放弃先验概率,而依靠似然比作为审判决策的指南(Sullivan 2019)。避免先验问题的另一种策略是考虑值的区间,并查看不同可能的先验对后验概率的影响程度(Finkelstein 和 Fairley 1970),如 1.4 节中所述。
7.4 引用类问题
法律概率论的另一个挑战是参考类问题。参考类问题最初由 Venn (1866) 提出,其出现是因为同一事件可能属于多个参考类,其中所讨论事件的频率不同。 Reichenbach(1935 [1949:374])等人给出的一种常见方法是依赖“可以编制可靠统计数据的最窄类别”。如果有可靠的统计数据,这在某些情况下可能有效。但是,如果某人属于同样狭窄的不同阶级怎么办?
以在新泽西州工作的尼日利亚公民查尔斯·肖努比 (Charles Shonubi) 为例,他因向美国走私海洛因而于 1991 年 12 月 10 日在纽约肯尼迪机场被捕。他被发现胃道内携带103个气球,内含427.4克海洛因。在量刑过程中,检察官辩称,由于 Shonubi 在被捕前曾七次往返于美国和尼日利亚之间,因此他走私的海洛因总量超过了 427.4 克。检方提供了有关从1990年9月1日至1991年12月10日在肯尼迪机场被捕的117名尼日利亚毒品走私者的海洛因数量的数据。检察官的专家Boyum博士计算出99%的Shonubi Smloggibi在在最后一次旅行之前,至少2090.2克(美国诉Shonubi 895 F. Supp 460, E.D.N.Y. 1995年。
Shonubi是参考班的成员:“人们在尼日利亚和纽约之间旅行时发现海洛因的人”,也是“乔治华盛顿桥的收费者”级。为什么要依靠前者而不是后者来推断肖诺比走私多少海洛因? (Colyvan,Regan和Ferson 2001)。接下来的内容研究了参考类问题对法律概率主义构成的具体困难以及法律概率主义者的响应方式。
7.4.1挑战
Allen and Pardo(2007)认为,参考类问题对法律概率构成了挑战,更具体地是对诸如似然比之类的证据强度的概率度量(请参见第2节中的早期)。问题在于,根据所选择的参考类别,可以分配相同的证据不同的似然比。例如,与DNA匹配相关的可能性比例的分母是匹配的可能性,因为一个与犯罪无关的随机人是来源。此概率取决于选定人群中剖面的频率。但是应该选择哪些参考人群?由于自然世界中的任何内容都没有将一个参考阶层比另一个参考类别(论证),因此可能性比将是对证据力量的任意度量。
通过指出专家证人与多个参考类合作并娱乐价值范围来驳斥这一挑战很容易(Nance 2007)。实际上,在评估DNA证据时,习惯依靠多个参考类是习惯的。在Darlingv。State,808 So。例如,2d 145(2002年Fla。2002),一名居住在奥兰多的波兰妇女被性侵犯和杀害。 DNA专家作证了多个随机匹配概率,依靠迈阿密地区的非裔美国人,高加索人和西班牙裔西班牙裔的频率。由于肇事者可能属于这些种族中的任何一个,因此专家所考虑的群体在可能发生的事情的不同情况下都相关。
与专家证人不同,上诉法院通常更喜欢仅考虑一个参考类别。在另一个案例中,与犯罪痕迹相匹配的迈克尔·皮萨罗(Michael Pizarro)因强奸和窒息了他13岁的姐姐而被定罪(Peoplev。Pizarro,110 Cal.App.App.4th 530,2003年,2003年)。 FBI分析师在试验中作证说,找到另一个无关的西班牙裔人的遗传特征的可能性约为1/250,000。由于犯罪者的种族尚不清楚,皮萨罗(Pizarro)提出上诉,认为DNA证据是不可接受的。上诉法院支持皮萨罗(Pizarro),并反对对西班牙裔人口的频率估计以及任何其他种族或族裔群体的频率。法院写道:
如果犯罪者实际上是亚洲人,那么有多少西班牙裔,高加索人,黑人或美洲原住民都类似于肇事者。
当专家证人证明多个参考课程时,上诉法院表现出的不安是可以理解的。也许应该选择最有利于被告的参考类别,从而使被告有疑问的好处。在某些情况下,这可能是合适的。但是,假设A组人中与DNA匹配相关的随机匹配概率为十分之一,而B组中的人中有1亿分之一病例削弱了DNA的罪恶力匹配的匹配不足。
7.4.2相关性和关键问题
法律概率主义者已经制定了不同的标准来确定最合适的参考类别。富兰克林(2011)很乐观。在他的方法上,最合适的参考类用于绘制事件或结果B的推断是由与B相关的所有功能的交集定义的类别的类别。 b具有所讨论的功能。将使用适当的统计标准(例如两个变量之间的相关系数)来测量共同变化。例如,在Shonubi案中,诸如尼日利亚人,毒品快递员(朝肯尼迪国际机构)之类的特征都与推断Shonubi携带的毒品总量有关。有数据可用的其他功能,例如在乔治华盛顿大桥的收集器中,这是无关紧要的。然而,富兰克林方法的乐观情绪因参考类问题的普遍性而变得黯淡(有关更多详细信息,请参见Hájek2007)。
最适当的参考类别的选择不仅关注相关性,还可以包括统计(或认知)标准以及非症状标准的混合。 Dahlman(2018)提出了一个关键问题的列表,例如:参考类别异质还是同质性?强大吗?它是否使人们进入参考阶级不公平?前两个问题是认识论,但第三个问题不是。如果某些种族或社会经济群体中的人们比其他人更频繁地从事犯罪行为,那么依靠种族或社会经济参考阶级可能会增强社会对这些群体成员的污名和偏见。因此,应避免依靠这些参考类别,不是因为它们是无关紧要的,而是因为它们是偏见的。
7.4.3模型选择
可以将参考类问题视为模型选择问题的特定情况(Cheng 2009)。该模型应在某种程度上捕获数据,但不要过分贴合数据。数据中的随机变化不应在模型中内置。在统计数据中,存在不同的模型选择标准,最著名的是Akaike的信息标准(AIC),这是模型与数据拟合及其复杂性之间的权衡的流行度量。再次考虑Shonubi案件。为了预测运输的海洛因shonubi的总量,可以使用一个简单的线性模型,每个参考类别都带有经验建立的乘数β,以根据一次旅行携带的药物携带的预期药物的预期总量。选择太通用的类(例如“航空乘客”)会降低模型的经验充足性,但是依靠太狭窄的类别会包含随机噪声。使用类“收集器”类的模型显然(就诸如AIC之类的统计措施而言)的模型比基于“肯尼迪国际机构的尼日利亚毒品快递员”的模型要差。
Colyvan和Regan(2007)认为,参考类问题是模型不确定性的一种形式。对于他们来说,参考类问题源于应采用的特定统计模型的不确定性。由于讨论了替代模型,因此在Shonubi情况下,模型不确定性很明显。第一款模型是将Shonubi乘以他在尼日利亚和纽约之间进行的旅行数量时发现的金额。诚然,这个模型太简单了。检方的专家证人博伊姆博士开发了第二种模型。它基于DEA数据,包括通过从117个已知病例中重新采样七个净权量的七次近采样组来模拟100,000次可能的七次旅行。
博伊姆(Boyum)的模型受到案件芬克尔斯坦(Finkelstein)博士的批评,他抱怨该模型没有考虑到旅行之间的系统差异。据推测,随着经验丰富,走私者会倾向于携带更大的数量。当他们携带大量数量时,应该更有可能被逮捕。如果旅行效应成立,那么数据主要是关于倾向于携带比初学者更多的高级走私者。没有发现或反对旅行效应理论的经验证据。数据中缺少有关先前旅行数量的信息,因此无法开发出适当的旅行效果回归模型。另一方面,温斯坦法官认为,初学者的走私者确实会用葡萄吞咽,因此学习曲线不应过高。此外,与高级走私者相比,初学者更有可能被逮捕。如果是这样,数据不会被旅行效应偏见。有趣的是,有关尼日利亚毒品走私实践的信息破坏了旅行效应理论:毒品卡特尔并没有浪费金钱来发送半填充的毒品mu子,而是让他们在第一次旅行前几周练习吞咽气球(Toreaser 1992; Wren 1999)。
案件裁定后,发表了肖努比证据的统计分析。这些分析考虑了其他潜在错误来源,例如离群值和偏见数据。 Gastwirth,Freidlin和Miao(2000)表明,由于对离群值的敏感性,总数高于3000克的推断是不稳定的。但是,即使以最有利于被告的方式查看数据,药物的总量也应高于1000克阈值(Gastwirth,Freidlin和Miao 2000; Izenman 2000a,b)。