统计哲学(五)

贝叶斯统计推断的结果并不总是被报告为后概率。通常,兴趣仅在于比较两个假设的后代的比率。由贝叶斯定理我们有

p

((

小时

θ

s

p

((

小时

θ

'

s

=

p

((

小时

θ

p

((

s

小时

θ

p

((

小时

θ

'

p

((

s

小时

θ

'

,,,,

如果我们假设同等的先验

p

((

小时

θ

=

p

((

小时

θ

'

,我们可以利用假设的可能性(所谓的贝叶斯因子)的比例来比较假设。

这是茶品尝女士的例子的贝叶斯程序。

贝叶斯统计分析

考虑假设

小时

1

/

2

小时

3

/

4

,在上述中被用作零和替代方案,

小时

小时

'

,分别。我们没有根据数据选择它们,而是在它们上分配了一个先验分布,以便零是替代方案的两倍:

p

((

小时

1

/

2

=

2

/

3

p

((

小时

3

/

4

=

1

/

3

。表示特定的猜测顺序

n

在5杯中正确使用

s

n

/

5

,我们有

p

((

s

n

/

5

小时

1

/

2

=

1

/

2

5

依靠

p

((

s

n

/

5

小时

3

/

4

=

3

n

/

4

5

。和以前一样,五个猜测的可能性比变成

p

((

s

n

/

5

小时

3

/

4

p

((

s

n

/

5

小时

1

/

2

=

3

n

2

5

因此,5个正确猜测后的后比率是

p

((

小时

3

/

4

s

n

/

5

p

((

小时

1

/

2

s

n

/

5

=

3

5

2

5

1

2

4

该后验是由概率理论的公理,尤其是贝叶斯定理得出的。它告诉我们将样本数据纳入我们的信念之后,每个假设都有多么可信。

请注意,在上述说明中,后验概率写为

p

((

小时

θ

s

n

/

5

。一些贝叶斯推论的一些解释更喜欢将修订的意见表示为新的概率函数

p

'

((

走为

,然后等同于旧

p

((

走为

s

。对于贝叶斯推论的基本形式工作,Tis的区别是不必要的。但是我们将在第4.3.3节中返回它。

4.1.2连续模型

在许多应用中,模型不是有限的假设集,而是由实价参数标记的连续体。这导致了对假设和可能性分布的定义的微妙变化。先验和后验必须作为所谓的概率密度函数写下来,

p

((

小时

θ

d

θ

。可能性需要通过限制过程来定义:概率

p

((

小时

θ

无限小,以至于我们无法定义

p

((

s

小时

θ

以正常方式。但是除此之外,贝叶斯机械的工作原理完全相同:

p

((

小时

θ

s

d

θ

=

p

((

s

小时

θ

p

((

s

p

((

小时

θ

d

θ

最后,求和需要用集成来代替:

p

((

s

=

θ

ε

θ

p

((

小时

θ

p

((

s

小时

θ

d

θ

该表达式通常称为模型的边际可能性:它表达了数据的可能性。

后概率密度为结论提供了一个可能从样本中得出的结论的基础

s

,并且类似于估计准确性的估计和措施。首先,我们可以得出对参数的期望

θ

,我们认为

θ

不断变化:

θ

=

θ

θ

p

((

小时

θ

s

d

θ

如果模型通过凸集(通常为凸集)进行参数,则会有一个假设

小时

θ

在模型中。该假设可以用作贝叶斯的估计。与置信区间类似,我们还可以从后验概率分布中定义所谓的信用间隔或可信度间隔:大小的间隔

2

d

围绕期望值

θ

,写

[

θ

-

d

,,,,

θ

+

d

这是给出的

,这样

θ

+

d

θ

-

d

p

((

小时

θ

s

d

θ

=

1

-

ε

这个值的范围

θ

使得相应的后验概率

小时

θ

总计为

1

-

ε

总后概率。

还有许多其他方法来定义贝叶斯的估计和信用间隔

θ

基于后密度。贝叶斯分析提供的特定估计类型可以由科学家的需求确定。任何贝叶斯估计在某种程度上都将类似于最大似然估计量,因为可能性在贝叶斯形式主义中的核心作用。但是,输出还将取决于假设的先验概率,一般而言,当样本量趋向于无穷大时,它只会倾向于最大似然估计器。有关此所谓的“清洗”先验的更多信息,请参见第4.2.2节。

4.2贝叶斯方法的问题

关于贝叶斯方法的大多数争议涉及假设的概率分配。一组重要的问题围绕着这些概率作为信念的解释,即采取行动或类似的意愿。另一组问题与确定先前的概率分配以及可能控制的问题有关。

4.2.1对假设的概率的解释

这里的总体问题是我们应该如何理解分配给统计假设的概率。自然,解释将是认识的:概率表达了对假设的信念的力量。尝试物理解释毫无意义,因为该假设不能被视为可重复的事件,也不能被视为可能发生某种趋势的事件。

这留下了对概率分配作为信念的力量的几种解释。对概率的一种非常有影响力的解释是将概率与愿意押注某些赔率的意愿有关(参见Ramsey 1926,De Finetti 1937/1964,Earman 1992,Jeffrey 1992,Howson 2000)。根据这种解释,分配了

3

/

4

例如,要提出一个主张,这意味着我们准备最多支付0.75美元的投注合同,如果该提议为真,那将支付1美元,如果命题是虚假的,那将是一文不值的。然后,所谓的荷兰书籍论点支持了在概率分配中正确表达的信念程度的说法:如果代理商不符合概率理论的公理,那么一个恶性博彩公司可以提出一组似乎是公平的赌注对代理商而言,但这导致了一定的货币损失,因此被称为荷兰人,大概是由于荷兰的商业声誉。这种解释将信念直接与其行为后果联系在一起:认为某事与愿意从事特定活动的意愿,例如下注。

这种解释对假设的概率分配有几个问题。首先,押注统计假设的真理似乎几乎没有意义,因为这些假设无法伪造或验证。因此,对他们的投注合同将永远不会兑现。更普遍的是,尚不清楚通过以这种方式将其与行为联系起来,可以正确地构建有关统计假设的信念。有人认为(例如,阿曼德特(Armendt)1993),这种构架概率作业的方式引入了对信念的务实考虑因素,即成功地导航世界,这本身更关心作为对世界的真实代表的信念。

一个有些不同的问题是,贝叶斯形式主义,特别是它对统计假设的概率分配的使用,这表明贝叶斯统计学家的封闭式封闭式封闭性。以模型为例,请回顾上述示例

=

{

小时

1

/

2

,,,,

小时

3

/

4

}

。贝叶斯形式主义要求我们分配这两个假设的概率分布,进一步是模型的概率是

p

((

=

1

。即使是理想理性的代理人,她确实拥有一个实现的功能,这表达了对假设的看法,这是一个很强的假设。此外,对假设的概率分配似乎意味着贝叶斯统计学家确定该模型中包含了真正的假设。这是贝叶斯统计学家在分析开始时必须承诺的过分强烈主张。它与广泛共享的方法论见解(例如Popper 1934/1956)的广泛共享,根据该见解,科学理论必须始终开放进行修订(参见Mayo Mayo,1996年)。在这方面,贝叶斯的统计数据对科学询问的性质并不公平,这似乎是如此。

刚刚概述的问题在贝叶斯人期望得到充分校准的问题中获得了数学上更复杂的形式。 Dawid(1982)中提出的这个问题涉及贝叶斯预报员,例如,一个天气预报员决定了第二天的每日降水概率。然后表明,这样一个天气预报员相信自己,从长远来看,他会以概率1收敛到正确的概率。但是,假设天气预报员意识到他的气象模型可能有些问题,因此设置可能会出错,因此设置有可能是错误的他在1以下的正确预测可能性。因此,气象员导致了不连贯的信念。贝叶斯统计分析似乎也提出了不切实际的要求,即使是理想的代理商也是如此。

4.2.2先验的确定

目前,假设我们可以将假设的概率解释为认知不确定性的表达。那么我们如何确定先前的概率?也许我们已经对模型中的假设有一个直观的判断,因此我们可以在此基础上确定先前的概率。否则,我们可能有其他标准来选择我们的先验。但是,确定先验的程序存在一些严重的问题。

首先考虑这样的想法,即经营贝叶斯分析的科学家本人提供了先前的概率。这个想法的一个明显问题是,科学家的意见可能不够精确,无法确定完整的先前分布。假设科学家可以将她的观点转变为模型上的单个实现功能,这似乎并不现实,尤其是如果模型本身由一个假设的连续体组成。但是,更紧迫的问题是,不同的科学家将提供不同的先前分布,并且这些不同的先验将导致不同的统计结果。换句话说,贝叶斯统计推断将不可避免的主观组成部分引入了科学方法。

统计结果取决于科学家的初始意见是一件事。但这可能是这样的,科学家对假设没有任何意见。她应该如何将先前的概率分配给假设?先验将必须表达她对假设的无知。表达这种无知的主要思想通常是冷漠的原则:无知意味着我们在任何一对假设之间都是冷漠的。对于有限数量的假设,冷漠意味着每个假设都具有同等的概率。对于假设的连续性,冷漠意味着概率密度函数必须是均匀的。

然而,有不同的方式应用冷漠原理,因此与假设相比,可以算作无知的表达情况不同。在贝特兰的悖论中,很好地说明了这种见解。

伯特兰的悖论

考虑一个在等边三角形周围绘制的圆,现在想象一个长度超过圆直径的针织针扔到圆上。圆圈内的针截面比等边三角形的侧面更长的概率是多少?为了确定答案,我们需要参数化针的抛出方式,确定所包含部分确实比三角形的参数值的子集,并表达我们对确切的针头掷针中的无知参数上的概率分布,因此可以得出上述事件的概率。问题在于,我们可以提供多种参数化针头如何降落在圆圈中的方法。如果我们在交叉路口使用针与圆的切线相切的角度,则只有在角度之间的角度在

60

120

。如果我们假设我们的无知是通过这些角度上的统一分布来表达的,范围从

0

180

,那么事件的概率将是

1

/

3

。但是,我们还可以参数化针头不同的方式,即以针的最短距离到圆的中心。在距离上的统一概率将导致

1

/

2

杰恩斯(Jaynes,1973年和2003年)对这个谜语进行了非常有见地的讨论,并认为它可以通过在某些转型下依靠问题的不变来解决。但是,目前的一般信息是,冷漠的原则并没有导致独特的先验选择。关键不是说关于参数的无知很难在这些值上以概率分布来表达。相反,在某些情况下,我们甚至不知道要使用哪些参数来表达我们的无知。

在某种程度上,可以通过对科学理论采取不同的态度以及放弃绝对客观性的理想来解决贝叶斯分析的主观性问题。确实,有人会说,统计方法适应科学家之间的意见差异是正确的。但是,如果先前的分布表示无知而不是意见,则会错过标记:捍卫意见差异的合理性似乎更难源于阐明无知的不同方式。现在,基于所谓的融合结果,对客观性的担忧也有了更积极的答案(例如,Blackwell和Dubins 1962以及Gaifman and Snir 1982)。事实证明,先前选择的影响会随着数据的积累而减少,并且在极限中,后验分布将收敛到一个最佳假设的单顿,这是由采样数据确定的,因此完全独立于先前分配。然而,在简短和中间,仍然存在主观先前选择的影响。

总结,贝叶斯统计数据对主观输入敏感仍然存在问题。经典统计程序的不可否认的优势是它们不需要任何这样的输入,尽管可以说经典程序反过来又对有关样本空间的选择敏感(Lindley 2000)。在此方面,贝叶斯统计学家指出,能够将初始意见纳入统计分析的优势。

4.3对批评的回应

贝叶斯统计的哲学对上述问题提供了广泛的回应。一些贝叶斯人咬着子弹,捍卫贝叶斯方法的本质主观特征。其他人则试图通过提供客观动机来确定先验概率或强调贝叶斯形式主义本身的客观特征来纠正或弥补主观性。

4.3.1严格但经验知情的主观主义

对贝叶斯统计数据的一种非常有影响力的观点将其投入了分析的主观性(例如Goldstein 2006,Kadane 2011)。所谓的个人主义者或严格的主观主义者认为,统计方法不提供任何客观指南是正确的,指出了任何形式的知识的根本主观来源。因此,至少在某种程度上消除了关于先前分布的解释和选择的问题:贝叶斯统计学家可以随意选择她,这是她信仰的一种表达。但是,值得强调的是,对贝叶斯统计的主观主义观点并不意味着可以忽略从经验事实中得出的所有约束。没有人否认,如果您有进一步的知识对模型或先验施加限制,那么必须适应这些约束。例如,在下一个统计推断中,今天的后验概率可以用作明天的先验。关键是,这种约束涉及信仰的合理性,而不是统计推断本身的一致性。

在以务实的方式解释概率分配的人中,主观主义者的观点最为突出,并通过上述荷兰书籍论点以概率分配来激发信念的代表。这种方法的核心是Savage和De Finetti的工作。 Savage(Savage,1962)提出了与决策理论同时统计的公理,这是关于实际理性的数学理论。他认为,概率分配根本没有任何意义,并且只能在代理人面对行动之间选择的情况下,即在一组赌注之间进行选择。同样,de Finetti(例如,1974年)提倡对统计数据的观点,即概率信念的经验后果以赌注意愿表达,但他并没有完全依赖于决策理论。值得注意的是,因此,对贝叶斯统计的主观主义观点似乎是基于相同的行为主义和经验主义,激发了尼曼和皮尔森发展古典统计。

请注意,所有这些都使第4.2.1节的解释问题的一个方面重新出现:先前对假设的分布将如何使自己显而易见,以便可以通过信念正确解释它,在这里被理解为愿意行动的意愿?对这个问题的一个回答是通过概率分配转向代表信念程度的不同动机。在De Finetti的工作之后,几位作者提出了对信仰的概率表达的证明,这些证明不是基于行为目标,而是基于具有准确代表世界的信念的认知目标,例如Rosenkrantz(1981),Joyce,Joyce(2001)(2001年) ,Leitgeb和Pettigrew(2010),Easwaran(2013)。 Schervish,Seidenfeld和Kadane(2009)实现了对这一想法的强烈概括,这是基于更长的传统,即使用得分规则来实现统计目标。另一种方法是,任何正式的信念代表都必须尊重某些逻辑约束,例如,考克斯(Cox)根据部分信念本身的性质,为信仰的表达提供了一种论点。

(本章完)

相关推荐