统计哲学(六)
但是,很难解释对先前的假设的最初主观主义反应来自de Finetti所谓的代表定理,该定理表明,每个先前的分布都可以与其自身的预测集相关联,因此与其自身的行为相关联结果。换句话说,de Finetti展示了先生的确实与可以进行博彩解释的信念相关联。
4.3.2游览:表示定理
de Finetti的表示定理将预测的规则(作为给定样本数据的函数)与统计模型背景的贝叶斯统计分析相关联。有关有用的介绍,请参见Festa(1996)和Suppes(2001)。 de Finetti考虑了一个生成一系列时间指数观察的过程,然后他研究了将这些有限段作为输入的预测规则,并使用可以分析此类样本并提供预测的统计模型,将这些有限的段作为输入并返回对未来事件的概率。 de Finetti的关键结果是,一个特定的统计模型,即观察值独立和相同分布的所有分布的集合,可以等同于可交换预测规则的类别,即预测的规则不取决于预测的规则观察结果的顺序。
让我们在更正式的细节中考虑表示定理。为简单起见,说该过程会产生时间指标的二进制观测值,即0和1。预测规则需要这么长的一点字符串
t
,表示为
s
t
,作为输入,并返回该事件的概率,即字符串中的下一点是1,表示为
问
1
t
+
1
。因此,我们将预测规则作为部分概率分配编写
p
((
问
1
t
+
1
∣
s
t
)
。可交换预测规则是独立于字符串中的位顺序提供相同预测的规则
s
t
。如果我们编写字符串的事件
s
t
总共有
n
观察1
s
n
/
t
,然后可交换的预测规则被写成
p
((
问
1
t
+
1
∣
s
n
/
t
)
。至关重要的属性是,预测的值不受0和1在字符串中显示的顺序影响
s
t
。
De Finetti将这组可交换预测规则与特定类型的统计模型的推论联系起来。 De Finetti认为的模型包括所谓的Bernoulli假设
小时
θ
,即,该假设
p
((
问
1
t
+
1
∣
小时
θ
∩
s
t
)
=
θ
。
这种可能性不取决于字符串
s
t
那以前了。最好的假设是确定固定偏见的
θ
对于二进制过程,
θ
ε
θ
=
[
0
,,,,
1
这是给出的
。表示理论上是在Bernoulli假设和可交换的预测规则上进行先验的一对一映射。也就是说,每个先前的分布
p
((
小时
θ
)
可以与一个可交换的预测规则相关联
p
((
问
1
t
+
1
∣
s
n
/
t
)
,反之亦然。在De Finetti得出的原始表示定理之后,证明了其他几种和更一般的表示定理,例如,对于马尔可夫过程的部分可交换的序列和假设(Diaconis and Freedman 1980,Skyrms 1991),用于聚类预测和分区过程(Kingman)(Kingman)(Kingman) 1975年和1978年),甚至用于图的序列及其生成过程(Aldous 1981)。
表示定理将统计假设上的先前分布等同于预测规则,因此将概率分配等同于可以给出主观和行为解释的概率分配。这消除了上面表达的忧虑,即对假设的先前分布无法主观解释,因为它不能与信念相关的行动意愿:先验与特定的预测唯一有关。但是,对于de finetti而言,代表定理提供了完全取消统计假设的原因,因此除了主观意见以外的任何事物(参见Hintikka 1970)以外的任何概率概念:可以将其概率主张的假设视为。请参阅无形的Chancy过程是多余的形而上学行李。
并非所有的主观主义者同样不赞成使用统计假设。杰弗里(Jeffrey,1992)提出了所谓的混合贝叶斯主义,其中主观解释了假设上的分布与假设分布的物理解释相结合,该分布假设定义了样品空间。罗马(Romeijn,2003,2005,2006)认为,对假设的先验是一种有效,更直观的方法来确定归纳预测,而不是直接指定预测系统的特性。
使用假设的这种优势似乎与科学实践相一致,在科学实践中,假设是常规使用的,并且通常受到数据生成过程的机械知识的推动。严格来说,统计假设可以被消除,这一事实并不能消除它们在预测中的效用。
4.3.3 贝叶斯统计作为逻辑
尽管贝叶斯统计似乎不可避免地具有主观性,但从某种意义上说,贝叶斯统计可能声称具有客观性。可以证明贝叶斯形式主义满足一定的合理性、连贯性和校准性的客观标准。因此,贝叶斯统计在元层面上满足了客观性的要求:虽然它所处理的观点保留了主观方面,但它处理这些观点的方式,特别是数据对其影响的方式,是客观的。正确的,或者说是这样认为的。支持贝叶斯容纳数据的方式(即通过条件化)的论点,已由动态的荷兰书籍论点在务实的背景下提供,其中概率被解释为愿意下注(参见 Maher 1993,van Fraassen 1989)。类似的论点也被提出,理由是我们的信仰必须按照 De Finetti (1974) 的思路准确地代表世界,例如 Greaves 和 Wallace (2006) 以及 Leitgeb 和 Pettigrew (2010)。
在支持贝叶斯容纳证据的方式的论据中必须做出重要区分:作为数学给定的贝叶斯定理与作为随时间的一致性原则的贝叶斯规则之间的区别。该定理只是概率分配之间的数学关系,
p
((
小时
∣
s
)
=
p
((
小时
)
p
((
s
∣
小时
)
p
((
s
)
,,,,
因此不存在争论。支持通过概率分配表示主体认知状态的论证也为贝叶斯定理作为信念度的约束提供了支持。条件概率
p
((
小时
∣
s
)
可以解释为对假设的置信程度
小时
条件是样品
s
获得,作为概率分配捕获的认知状态的组成部分。相比之下,贝叶斯规则对表示代理在不同时间点的认知状态的概率分配提出了约束。
p
s
((
小时
)
=
p
((
小时
∣
s
)
,,,,
它确定了新的概率分配(表示获得样本后主体的认知状态)与旧分配(表示样本进入之前的认知状态)系统相关。在统计学哲学中,许多贝叶斯主义者采用贝叶斯' 隐含地规则,但在下文中我将仅假设贝叶斯统计推断依赖于贝叶斯定理。
无论关注的是贝叶斯规则还是贝叶斯定理,上述论点的共同主题是从逻辑角度来看待贝叶斯统计推断,并关注其内在的连贯性或一致性(参见Howson 2003)。虽然贝叶斯推理在统计中的使用无可否认是归纳性的,但贝叶斯推理因此获得了演绎性或至少是非放大性的特征:推理中得出的所有结论在某种程度上已经存在于前提中。在贝叶斯统计推断中,这些前提是由假设的先验给出的,
p
((
小时
θ
)
为了
θ
ε
θ
和似然函数,
p
((
s
∣
小时
θ
)
,根据每个假设确定
小时
θ
这些前提固定了空间上的单个概率分配
米
×
s
在推论一开始。反过来,结论是这种概率分配的直接结果。它们可以通过应用概率论定理(尤其是贝叶斯定理)来推导。因此,贝叶斯统计推断成为概率逻辑的一个实例(参见 Hailperin 1986、Halpern 2003、Haenni 等人 2011)。
总而言之,有几个论点表明贝叶斯定理或贝叶斯规则的统计推断在客观上是正确的。这些论点邀请我们将贝叶斯统计视为概率逻辑的一个实例。这种对贝叶斯统计推断逻辑性的诉求可能为其主观特征提供部分补救。此外,统计推论的逻辑方法避免了形式主义对代理人提出不切实际的要求以及假定代理人具有一定知识的问题。就像演绎逻辑一样,我们不需要假设推论在心理上是现实的,也不需要代理人实际上相信论证的前提。相反,这些论证为主体提供了一个规范的理想,并采用一致性约束的条件形式:如果你接受前提,那么这些就是结论。
4.3.4 外围:感应逻辑和统计
概率逻辑的一个重要实例是归纳逻辑,由 Carnap、Hintikka 等人设计(Carnap 1950 和 1952、Hintikka 和 Suppes 1966、Carnap 和 Jeffrey 1970、Hintikka 和 Niiniluoto 1980、Kuipers 1978、Paris 1994、Nix 和2006 年巴黎奥运会,巴黎和沃特豪斯 2009)。从历史上看,卡纳平归纳逻辑的发展先于上述概率逻辑,并且或多或少与统计哲学中的争论分开。但是卡尔纳普的逻辑系统可以很容易地置于贝叶斯推理的逻辑方法的背景下,这样做实际上是非常有洞察力的。
为了简单起见,我们选择与表示定理的阐述中使用的设置类似的设置,即二进制数据生成过程,即0和1的字符串。预测规则确定事件的概率,表示为
问
1
t
+
1
,根据给定长度的位串,字符串中的下一位是 1
t
,表示为
s
t
卡尔纳普和追随者设计了具体的可交换预测规则,大多是直接规则的变体(Reichenbach 1938),
p
((
问
1
t
+
1
∣
s
n
/
t
)
=
n
+
1
t
+
2
,,,,
在哪里
s
n
/
t
表示一个长度的字符串
t
其中
n
条目均为 1。卡纳普从样本概率分配的约束中得出了这样的规则。其中一些约束可以归结为概率公理。其他约束,以及它们之间的可交换性,都是通过诉诸所谓概率的逻辑解释而独立激发的。在这种逻辑解释下,概率分配必须尊重样本空间变换下的某些不变性,类似于以特定方式限制语言的真值评估的逻辑原理。
卡纳普归纳逻辑是概率逻辑的一个实例,因为它的顺序预测一开始都是基于单个概率分配,并且因为它依赖贝叶斯定理来使预测适应样本数据(参见 Romeijn 2011)。与贝叶斯统计推断的一个重要区别是,对于卡尔纳普来说,一开始指定的概率分配仅适用于样本,而不适用于假设。然而,根据德菲内蒂的表示定理,卡尔纳普的可交换规则可以等同于特定的贝叶斯统计推论。另一个区别是卡纳普归纳逻辑赋予特定的可交换规则优先地位。根据德菲内蒂表示定理,这取决于对一组特定优先先验的选择。如下文进一步阐述的,卡纳皮归纳逻辑因此与客观贝叶斯统计相关。是否可以像卡尔纳普和追随者所认为的那样,对概率分配的进一步限制被视为逻辑,或者正如德菲内蒂和追随者所认为的那样,逻辑的名称最好保留给孤立的概率形式主义,这是一个有争议的问题。
4.3.5先验
对贝叶斯统计推断主观性的进一步回应直接针对先验分布:我们可以提供进一步的合理性原则,通过这些原则可以客观地选择先验。文献提出了几个用于填充模型先验的客观标准。其中每一个都声称是对模型参数值完全无知或对参数的最少信息的正确表达。这里讨论三个这样的标准。
在伯特兰悖论的背景下,我们已经讨论了冷漠原则,根据该原则,概率应该均匀地分布在可用的可能性上。这个想法的进一步发展是要求分布应该具有最大熵。值得注意的是,使用熵最大化来确定信念程度比仅在统计学中具有更广泛的应用:类似的想法被应用于认识论等不同领域(例如,Shore and Johnson 1980、Williams 1980、Uffink 1996 以及 Williamson 2010) 、归纳逻辑(Paris 和 Vencovska 1989)、统计力学(Jaynes 2003)和决策理论(Seidenfeld 1986,Grunwald 和 Halpern 2004)。在客观贝叶斯统计中,该思想应用于模型的先验分布(参见 Berger 2006)。对于有限数量的假设,分布的熵
p
((
小时
θ
)
被定义为
e
[
p
这是给出的报价
=
Σ
θ
ε
θ
p
((
小时
θ
)
日志
p
((
小时
θ
)
。
这一要求明确地导致了等概率假设。然而,对于连续模型,最大熵分布主要取决于模型中参数的度量。因此,主观性的负担转移到参数化上,但当然,我们很可能有充分的理由比其他参数化更喜欢特定的参数化(参见 Jaynes 1973)。
还有其他方法可以客观确定先验。鉴于上述问题,Jeffreys(1961)提出了一种在连续模型上选择先验的特别有吸引力的方法。所谓的杰弗里斯先验的一般思想是,分配给参数空间中的小补丁的先验概率与该补丁内的分布密度成正比。直观上,如果很多分布,即彼此之间差异很大的分布,被打包在参数空间中的一个小补丁上,则该补丁应该比变化很小的类似补丁具有更大的先验概率分布之间(参见 Balasubramanian 2005)。从技术上讲,这种密度由与费舍尔信息成比例的先验分布来表示。这些先验的一个关键优点是它们在参数空间的重新参数化下是不变的:新的参数化自然会导致分布密度的调整。
定义先验的最后一种方法称为参考先验(Berger et al 2009)。该提议始于这样的观察:我们应该最小化统计分析结果的主观性,因此我们应该最小化先验概率对后验概率的影响。参考先验的想法正是让样本数据在后验分布中拥有最大的发言权。但由于一开始我们不知道我们将获得什么样本,因此选择先验以最大化数据的预期影响。期望本身必须考虑到样本空间上的某种分布,但同样,我们很可能对后一种分布有充分的理由。
4.3.6 绕过先验
对先验主观性的另一种回应是扩展贝叶斯形式主义,以便在一定程度上保留先验的选择。在这种情况下,先验的主观选择就被规避了。将更详细地考虑两个这样的回应。
回想一下,统计假设的先验概率分布表达了我们对哪个假设是正确的不确定意见。分层贝叶斯模型(Gelman et al 2013)背后的中心思想是,将先验置于统计假设之上的相同模式可以在先验本身的级别上重复。更准确地说,我们可能不确定假设的先验概率分布是正确的。如果我们通过一组参数来表征可能的先验,我们可以用表征先验形状的参数的概率分布来表达先验选择的不确定性。换句话说,我们将不确定性在层次结构中上移了一层:我们考虑统计假设的多个先验,并比较这些先验在样本数据上的表现,就好像先验本身就是假设一样。
分层贝叶斯建模的思想(Gelman et al 2013)自然与 Carnapian 预测规则的贝叶斯比较(例如,Skyrms 1993 和 1996,Festa 1996)相关,也与最佳归纳方法的估计相关(Kuipers 1986,Festa 1993)分层贝叶斯建模还可以与另一种用于选择特定先验分布的工具相关。假设,即经验贝叶斯方法,它估计导致模型最大边际似然的先验。在科学哲学中,分层贝叶斯模型首次出现是由于 Henderson 等人(2010)。
还有一种响应完全避免了先验的选择。这种响应始于与分层模型相同的想法:我们不考虑模型中假设的单个先验,而是考虑它们的参数化集合。但是,区间值或不精确概率的支持者没有定义这个集合上的分布,而是声称我们关于先验的认知状态可以通过这组分布更好地表达,因此尖锐的概率分配必须用下限和上限来代替现在,不确定意见最好通过一组概率分配(或简称为信用集)来捕获的想法已有悠久的历史,并得到了广泛文献的支持(例如,De Finetti 1974,列维 1980 年,登普斯特 1967 年和 1968 年,谢弗 1976 年,沃利 1991 年)。鉴于统计哲学中的主要争论,区间值先验的使用确实形成了贝叶斯统计的有吸引力的扩展:它允许我们避免选择特定的先验,从而呈现出与经典统计学观点的和解。
这些理论发展可能看起来很有吸引力,但事实是它们大多在统计学哲学家中享有崇高的地位,并且并没有感动街上的统计学家。另一方面,由于良好的软件和数值近似方法的可用性,标准贝叶斯统计在过去十年左右的时间里急剧流行。而大多数贝叶斯统计的实际使用或多或少对统计结果的潜在主观方面不敏感,采用统一先验作为分析的中立起点,并依靠上述收敛结果来洗掉剩余的主观性(参见 Gelman 和 Shalizi 2013)。然而,科学家对建模的这种务实态度不应被误认为是对统计哲学中提出的问题的原则性回答(参见 Morey et al 2013)。