形式认识论(二)

第一个假设,即 p(ØR∣ØB) 非常高,似乎相当合理。对于世界上所有的非乌鸦来说,给定的物体是非乌鸦的概率相当高,特别是如果它不是黑色的。第二个假设是p(ØB∣H)=p(ØB)。换句话说,假设所有乌鸦都是黑色的,并不会改变给定物体不是黑色的概率。这个假设更具争议性(Vranas 2004)。如果所有的乌鸦都是黑色的,那么一些可能是黑色的东西就不是黑色的,即乌鸦。在这种情况下,不应该用 p(ØB∣H)<p(ØB) 来代替吗?另一方面,也许所有乌鸦都是黑色的并不会减少宇宙中黑色物体的数量。也许这只是意味着其他种类的东西更常见的是黑色的。幸运的是,事实证明我们可以用不太可疑的假设来取代 (ii)(Fitelson 2006;Fitelson 和 Hawthorne 2010;Rinard 2014)。但我们不能完全没有假设,这给我们带来了关于确认和概率的两个关键点。

第一点是尼科德准则失败了。乌鸦定理 (i) 和 (ii) 等假设并不总是成立。事实上,在某些情况下,发现一只黑色乌鸦实际上会降低所有乌鸦都是黑色的概率。怎么会这样?诀窍是想象这样一种情况:对于所有乌鸦都是黑色的假设来说,乌鸦的发现本身就是一个坏消息。如果所有乌鸦都是黑色的唯一方法就是乌鸦数量很少,就会发生这种情况。然后偶然发现一只乌鸦就表明乌鸦实际上很多,在这种情况下它们并不都是黑色的。 Good(1967)提供了以下具体的说明。假设只有两种可能:

所有乌鸦都是黑色的,尽管乌鸦和其他动物只有 100 只。

一千只乌鸦中只有一只非黑乌鸦,还有一百万种其他的东西。

在这种情况下,发生在乌鸦身上对 ØH 有利,因为 ØH 使乌鸦的异国情调降低了十倍。乌鸦是黑色的,这与 H 稍微吻合,但不足以抵消第一个效果:黑色乌鸦在 ØH 上并不罕见。这是与我们之前的“是”搭配的“但是……”。

第二点是一个影响深远的道德:有关证实的主张的命运往往关键取决于我们对 p 值所做的假设。 Nicod 的准则在 Good 的情况下失败,其中 p 为 p(R∧B∣H) 指定的值比为 p(R∧B∣ØH) 指定的值更低。但在另一种情况下,情况正好相反,尼科德准则确实适用。同样,像标准那样的乌鸦悖论的诊断仅适用于给定关于 p 的某些假设,例如乌鸦定理的假设 (i) 和 (ii)。单独的概率公理通常不足以告诉我们尼科德准则何时适用,或者确认何时小或大,积极或消极。

1.4 先验问题

最后一点是一个非常普遍、非常重要的现象。与一阶逻辑公理一样,概率公理也相当弱(Howson 和 Urbach 1993;Christensen 2004)。除非 H 是同义反复或矛盾,否则公理只告诉我们它的概率介于 0 和 1 之间。如果我们可以将 H 表示为两个逻辑上不相容的子假设 H1 和 H2 的析取,并且我们知道这些的概率子假设,那么第三个公理让我们计算 p(H)=p(H1)+p(H2)。但这只是把事情往后推了一步,因为公理本身只告诉我们 p(H1) 和 p(H2) 本身必须位于 0 和 1 之间。

概率公理的这一弱点产生了著名的先验问题,即初始概率从何而来的问题。它们总是基于之前收集的证据吗?如果是这样,科学探究如何开始?相反,如果它们不是基于先前的证据而是先验的,那么什么原则管辖这种先验推理?正式认识论在这个问题上存在分歧。所谓的客观主义者认为概率公理是不完整的,需要用额外的假设来补充,以确定应该开始探究的概率。 (无差异原理(PoI)是这里的主要候选者。参见概率解释的条目。)所谓的主观主义者反而认为,不存在单一的、正确的概率函数 p 来开始探究。不同的探究者可能会从不同的 p 值开始,因此他们中没有一个比其他人或多或少科学或理性。

在后面的章节中,先验问题将多次出现,说明其重要性和普遍性。

1.5 总结

我们已经看到,使用概率论形式化确认产生了一个在几个重要方面取得成功的解释:它证明了关于确认的几个不言而喻的真理,它将这些不言而喻的真理统一在一个方程中,并且解决了一个经典的悖论(更不用说我们没有解决的其他悖论了)不要讨论(Crupi 和 Tentori 2010))。

我们也看到它提出了一个问题,即先验问题,正式认识论者对于如何解决这个问题存在分歧。还有其他问题我们没有探讨,最显着的是逻辑全知和旧证据的问题(参见贝叶斯认识论条目的小节)。

这些问题和其他问题导致了对科学推理和一般推理的其他方法的探索和发展。有些人坚持概率框架,但在其中发展了不同的方法论(Fisher 1925;Neyman 和 Pearson 1928a,b;Royall 1997;Mayo 1996;Mayo 和 Spanos 2011;参见统计哲学条目)。其他理论则背离标准概率论,例如 Dempster-Shafer 理论(Shafer 1976;参见信念的形式表示条目),这是概率论的一种变体,旨在解决先验问题并进行其他改进。排名理论(Spohn 1988,2012;再次参见关于信念的形式表示的条目)也与概率论有一些相似之处,但从条件句的可能世界语义中汲取了很多灵感(参见关于指示性条件句的条目)。自举理论(Glymour 1980;Douven and Meijs 2006)完全抛弃了概率框架,而是从我们开始时基于演绎的方法中汲取灵感。还有其他方法开发了非单调逻辑(参见条目),这种逻辑不仅可以进行演绎推理,还可以进行可废止的归纳推理(Pollock 1995,2008;Horty 2012)。正式学习理论为研究各种方法的长期后果提供了一个框架。

在接下来的两节中,我们将以这里介绍的概率方法为基础,因为它是目前形式认识论中最流行和最有影响力的方法。但重要的是要记住,有各种各样的替代方法,而且这种方法也有其问题,我们很快就会遇到这些问题的一些后果。

2. 第二个案例研究:归纳问题

我们的很多推理似乎都涉及将观察到的模式投射到未观察到的实例上。例如,假设我不知道我持有的硬币是有偏见的还是公平的。如果我将其翻转 9 次并且每次都是反面,那么我预计第 10 次也将出现反面。这种推理有什么道理呢?休谟有句名言:没有任何东西可以证明这一点。在现代形式中,休谟的挑战本质上是这样的:这种推理的正当性必须诉诸归纳论证或演绎论证。诉诸归纳论证将是令人无法接受的循环。虽然演绎论证必须表明未观察到的实例将与观察到的实例相似,但这不是必然的事实,因此无法通过任何有效的论证来证明。因此,没有任何论据可以证明将观察到的模式投射到未观察到的情况上是合理的。 (Russell 和 Restall (2010) 提供了正式的发展。Haack (1976) 在这里讨论了归纳和演绎之间假定的不对称性。)

概率可以解决这个问题吗?如果我们不是推断未观察到的实例将类似于观察到的实例,而是推断它们可能类似于观察到的实例,该怎么办?如果我们可以从概率公理中推断出,鉴于到目前为止 9 次中有 9 次都是反面,那么下一次抛掷很可能会出现反面,那么这似乎就解决了休谟问题。

不幸的是,这样的推论是不可能的:概率公理根本不能得出我们想要的结论。怎么可能呢?考虑在 10 次抛掷过程中我们可能得到的所有不同的正面 (H) 和反面 (T) 序列:

哈哈哈哈哈哈

哈哈哈哈哈哈

哈哈哈哈哈哈

哈哈哈哈哈哈哈哈哈

哈哈哈哈哈哈哈

TTTTTTTTTH

TTTTTTTTTT

有 1024 个可能的序列,因此每个可能序列的概率似乎是 1/1024。当然,只有两条以连续9条尾巴开始,即最后两条。因此,一旦我们将范围缩小到以 9 次反面中的 9 次开始的序列,第 10 次抛掷反面的概率就是 1/2,与正面相同。更正式地说,应用条件概率的定义可以得出:

p(T10∣T1…9) =

p(T10∧T1…9)

p(T1…9)

=

1/1024

2/1024

=

1

2

所以看起来概率公理意味着前 9 次抛掷并没有告诉我们关于第 10 次抛掷的任何信息。

但事实上,概率公理甚至不包含这一点——它们实际上并没有提及 p(T10∣T1…9) 的任何内容。在上一段中,我们假设每个可能的抛掷序列都是等概率的,每个序列的 p(…)=1/1024 相同。但概率公理不需要这种“统一”分配。正如我们之前遇到先验问题(1.4)时所看到的,概率公理只告诉我们同义反复的概率为 1(矛盾概率为 0)。偶然命题可以具有从 0 到 1 的任何概率,这包括投掷序列为 HHHHHHHTHT 或任何其他 H 和 T 序列的命题。

如果我们使用 Carnap (1950) 提倡的不同方案来分配先验概率,我们就可以利用这种自由并获得更合理、更易于归纳的结果。假设我们不是为每个可能的序列分配相同的概率,而是为每个可能的 T 数分配相同的概率。我们可以得到 0 到 10 个 T,因此每个可能的 T 数量的概率为 1/11。现在,只有一种方法可以获得 0 T:

哈哈哈哈哈哈

因此,P(H1…10)= 1/11。但是有10种获取1 T的方法:

hhhhhhht

hhhhhhhth

hhhhhhhhh

thhhhhhhh

因此,这种可能性为1/11的可能性被分为10种方法,每个亚可持​​续性的概率为1/110,例如p(hhhhhhhhhh)= 1/110。然后有45种获取2 ts的方法:

hhhhhhhtt

hhhhhhtht

hhhhhhtht

tthhhhhhh

因此,在这里,1/11的概率分为45种方式,每个亚可持​​续性的概率为1/495,例如p(hthhhhhhthh)= 1/495。等等。

那么p(t10∣t1…9)会怎样?

p(t10∣t1…9)=

P(T10∧T1…9)

P(T1…9)

=

P(T1…10)

P(T1…10∨[T1…9∧H10])

=

P(T1…10)

P(T1…10)+P(T1…9∧H10)

=

1/11

1/11+1/110

=

10

11

因此,当我们根据Carnap的两阶段计划分配先前的概率时,我们将获得更合理的结果。但是,概率的公理不要求该方案。

这教我们的一件事是,概率公理对休ume的问题保持沉默。归纳推理与公理兼容,因为Carnap构造先前概率的方式使得初始字符串的9 ts很可能使第10个T。但是公理也与对诱导的怀疑兼容。在构造先前概率的第一个方法中,无论字符串有多长时间,TS都不会使下一个折腾更有可能成为T!实际上,有更多的方法可以构建产生“抗诱导”的先前概率,在这种情况下,我们观察到的TS越多,下一个折腾的可能性就越小。

不过,我们也学到了其他一些东西,更具建设性的东西:休ume的问题是先生问题的堂兄。如果我们能够证明卡纳普(Carnap)分配先前概率的方式是合理的,那么我们将在解决休ume的问题方面做得很好。 (为什么只在我们的路上呢?稍后又简要介绍:因为我们仍然必须证明使用条件概率作为我们的新的无条件概率指南。)我们可以证明Carnap的两阶段方案是合理的吗?这使我们参加了正式认识论的经典辩论。

2.1冷漠原则

如果您不得不在不了解任何马匹的情况下赌骑马,那您会押注哪一个?对您来说可能并不重要:每匹马都会像其他马一样赢得胜利,因此您在可用的下注之间会无动于衷。如果比赛中有3匹马,每匹马都有1/3的获胜机会。如果有5个,每个都有1/5的机会;等。这种推理很普遍,通常归因于冷漠原则:[5]

冷漠原则(POI)

鉴于n个相互排斥和共同详尽的可能性,没有一个可用的证据比其他人相比,每个证据的可能性为1/n。

POI一开始看起来很合理,甚至可能具有概念真理的风味。如果证据不利于证据,一个可能性比另一种可能性更有可能呢?然而,POI面临经典而顽固的挑战。

考虑比赛中列出的第一匹马,雅典娜。她有两种可能性,她会赢,她会输。我们的证据(或缺乏证据)都不偏爱任何可能性,因此POI说她获胜的可能性是1/2。但是假设比赛中有三匹马:雅典娜,比阿特丽斯和塞西尔。由于我们的证据不支持其他任何证据,因此POI要求我们将概率1/3分配给每个概率,这与我们先前的结论相矛盾,即雅典娜获胜的可能性为1/2。

麻烦的根源是,可能性可以细分为进一步的亚物种。雅典娜输掉的可能性可以细分为两个亚物业,一个比阿特丽斯获胜,另一个塞西尔获胜。由于我们缺乏任何相关证据,因此可用的证据似乎不利于更详细的可能性,而不是较优质的副本,从而导致了矛盾的概率分配。似乎我们需要的是选择一种单一的特权方式来分配可能性空间,以便我们可以始终如一地应用POI。

很自然地认为我们应该使用雅典娜,比阿特丽斯和塞西尔的三向划分的更细粒度的可能性。但是实际上,我们实际上可以进一步划分事物。例如,雅典娜(Athena)可能会全长赢得一半,长达四分之一的胜利,因此她获胜的可能性实际上是无限的。我们可以扩展POI以自然的方式处理这种无限的可能性分歧,说,如果雅典娜获胜,那么她将以1到2次胜利的可能性是她将以1/1赢得的可能性的两倍2和1长。但是,我们试图解决的同样问题仍然存在,以臭名昭著的伯特兰悖论的形式(Bertrand 2007 [1888])。

范弗拉森(Van Fraassen,1989)的以下示例很好地说明了悖论。假设一个工厂切割了边缘长度从0厘米到2厘米的铁立方体。下一个立方体脱离线路的概率是什么概率在0厘米至1厘米之间的边缘?没有有关工厂如何生产立方体的进一步信息,POI似乎说概率是1/2。从0到1覆盖1/2的范围从0到2的全部可能性范围。但是现在考虑以下问题:下一个立方体脱离线的概率是什么概率在0立方CM和1立方CM之间。 ?在这里,POI似乎说概率是1/8。对于从0到1的范围仅覆盖1/8,可能的量从0到8立方CM的全部范围。因此,我们对等效命题有两个不同的概率:当且仅当其体积在0立方CM和1立方CM之间时,一个立方体的边缘长度在0到1 cm之间。再次,POI给出的概率似乎取决于我们如何描述可能结果的范围。从长度上描述,我们得到一个答案。用数量描述,我们得到了另一个。

重要的是,伯特兰的悖论通常适用。无论我们对立方体的大小,马匹获胜的距离还是以实数测量的任何其他参数感兴趣,我们总是可以重新描述可能的结果的空间,以使POI分配的概率有所不同。即使是无限的可能性空间划分也无法解决问题:POI分配的概率仍然取决于我们如何描述可能性的空间。

当我们以概率术语构架归纳问题时,我们本质上面临着这个问题。早些时候,我们看到了两种相互竞争的方式,将先前概率分配给硬币抛弃序列。一种方式根据H和T发生的确切序列将可能的结果划分。 POI将每个可能的序列分配为1/1024的概率,结果前9个折腾对我们的第10次掷骰一无所知。第二种,carnapian的方式会根据TS的数量来划分可能的结果,而不管它们以序列出现在哪里。然后,POI分配了每个可能数量的TS相同概率1/11。结果是,前9次折腾告诉我们有关第10次掷骰的很多:如果前9个折腾是尾巴,则第10次折腾也有10/11的机会也有机会抬起尾巴。

因此,应用POI的一种方法导致归纳性怀疑,另一种产生的归纳乐观情绪似乎对科学和日常生活必不可少。如果我们可以澄清应如何应用POI并证明其使用合理,我们将对休ume的问题有答案(或至少上半年 - 我们仍然必须解决使用条件概率作为新的无条件指南的问题概率)。可以澄清和合理吗?

在这里,我们再次与正式的认识论中最深,最古老的鸿沟之一,即主观主义者和客观主义者之间。主观主义者认为,任何概率分配都是开始询问的合法,合理的方式。一个只需要符合三个概率公理才能合理。他们之所以采取这种观点,很大程度上是因为他们绝望地澄清了POI。例如,他们没有理由,例如,我们应该根据TS的数量首先划分Carnap,然后才根据这些TS出现的序列来对其进行细分。与这种怀疑密切相关的是对POI合理的前景的怀疑,即使一旦澄清,也可以将其与三个概率公理相提并论。我们尚未谈到三个公理应该是如何合理的。但是经典的故事是这样的:一个定理家族 - 直属书籍定理(参见条目)和代表定理(请参阅条目) - 表明与概率三个公理的任何偏差都会导致非理性的决策。例如,如果您偏离公理,您将接受一套注定要亏损的下注,即使您可以看到亏损是不可避免的先验。这些定理并没有扩展到对POI的侵犯,但是澄清了。因此,主观主义者得出的结论是,违反POI不是不合理的。

不过,面对归纳问题,主观主义者并不完全无助。据他们说,任何概率的初始分配都是合理的,包括Carnap。因此,如果您确实从carnap式的任务开始,那么您将是一个感应的乐观主义者,并且合理地是如此。只是您不必那样开始。取而代之的是,您可以开始将每个可能的HS和TS序列视为同样可能的序列,在这种情况下,您最终会引起感性怀疑。那也是合理的。根据主观主义,归纳是完全理性的,这并不是唯一的理性方式。

客观主义者认为,只有一种分配初始概率的方法(尽管有些允许一些灵活性(Maher 1996))。根据正统的客观主义,这些最初的概率由POI给出。至于POI相互矛盾的概率分配,具体取决于可能性的分裂,一些客观主义者建议限制它以避免这些不一致之处(Castell 1998)。其他人则认为,实际上概率分配依赖可能性的方式是适当的,因为这反映了我们怀孕的情况,我们的语言反映了我们对此事带来的知识(Williamson 2007)。还有一些人认为,POI的任务实际上并不取决于可能性的分裂方式,有时很难说出证据何时有可能比另一种可能性更喜欢一种可能性(White 2009)。

那证明POI是合理的呢?传统上,主观主义者通过呼吁上述定理之一:荷兰书籍定理或某种形式的代表定理来证明三个概率的理由。但是正如我们之前指出的那样,这些定理并没有扩展到POI。

(本章完)

相关推荐