统计哲学(五)
似然论的立场基于概率观点的特定组合。一方面,它仅使用样本空间上的概率,并避免将概率置于统计假设之上。因此,它避免了使用无法给出物理解释的概率。另一方面,它确实将样本空间上的概率解释为支持关系的组成部分,因此属于认知领域而不是物理领域。值得注意的是,似然主义方法与认识论形式方法的悠久历史非常吻合,特别是证实论(参见 Fitelson 2007),其中概率论用于阐明数据和假设之间的证实关系。确认措施总是将假设的可能性作为输入成分。它们提供了似然定律描述的支持关系的定量表达式。
Mayo (1996) 以及 Mayo 和 Spanos (2011) 提出了另一种经典统计认知方法。在过去十年左右的时间里,他们为推动科学哲学中的经典统计学议程做了很多工作,而科学哲学已经由贝叶斯统计学占主导地位。与奈曼最初的行为主义倾向相反,误差统计方法推进了对经典测试和估计程序的认知解读。梅奥和斯帕诺斯认为,经典程序最好被理解为推理:它们允许归纳推理。但他们欣然承认这些推论是可以推翻的,也就是说,它们可能会让我们误入歧途。经典过程总是与特定的错误概率相关,例如,错误拒绝或接受的概率,或者估计器落在特定范围内的概率。在梅奥和斯帕诺斯的理论中,这些错误概率具有认知作用,因为它们被用来表明程序许可的推论的可靠性。
梅奥和其他人的误差统计方法包括一般科学哲学以及哲学统计的特定观点。我们通过讨论严格测试的概念来简要关注后者(参见 Mayo 和 Spanos 2006)。其主张是,我们在严格检验假设的基础上获得了实验效应的知识,这些假设可以通过重要性和功效来表征。在梅奥的定义中,一个假设要通过两个条件的严格检验:数据必须与假设一致,并且数据与备择假设一致的概率必须非常低。忽略对“同意”和“低概率”的精确解释可能存在的争议,我们可以在这些要求中认可内曼和皮尔逊的标准。如果显着性较低,则检验很严格,因为数据必须与假设一致;而功效较高,因为这些数据必须不与替代假设一致,或者与替代方案一致的概率很低。
3.3.2 理论进展
除了对经典统计过程的重新解释之外,许多统计学家和哲学家还进一步发展了经典统计理论,以充分发挥其结果的认知作用。我们特别关注两个发展,即基准概率和证据概率。
证据概率理论起源于 Kyburg (1961),他开发了一个逻辑系统来处理与经典统计分析结果一致的结果。因此,证据概率属于建立经典统计学认知用途的尝试。 Haenni 等人 (2010) 以及 Kyburg 和 Teng (2001) 对证据概率进行了富有洞察力的介绍。该系统基于版本默认推理:统计假设附带置信水平,逻辑系统组织如何在推理中传播此类置信水平,从而建议使用哪种假设进行预测和决策。特别关注涉及用不同置信度标记的同一假设的多个实例的推论中置信度水平的传播,其中这些置信度来自于每个与特定群体相关联的不同数据集。证据概率有助于选择最佳置信水平,从而有助于为所考虑的案例选择适当的总体。换句话说,证据概率有助于解决前面提到的参考类问题。
基准概率提供了另一种赋予经典统计认知地位的方式。 Fisher (1930, 1933, 1935c, 1956/1973) 提出了基准概率的概念,作为一种推导假设概率分配的方法,而无需从一开始就假设统计假设的先验概率。基准论证是有争议的,人们普遍认为它的适用性仅限于特定的统计问题。 Dempster (1964)、Hacking (1965)、Edwards (1972)、Seidenfeld (1996) 和 Zabell (1996) 提供了富有洞察力的讨论。 Seidenfeld (1979) 提出了一项特别详细的研究,并进一步讨论了该论证在多参数情况下的有限适用性。 Dawid 和 Stone(1982)认为,为了运行基准论证,我们必须假设统计问题可以用一个平滑可逆的函数模型来捕获。 Dempster (1966) 为分布在以下情况的情况提供了这一想法的概括:
θ
不是唯一固定的,而是仅约束在上限和下限内(参见 Haenni 等人 2011)。至关重要的是,这种对值的概率分布的约束
θ
是在不假设任何分布的情况下获得的
θ
一开始。
3.3.3 偏差:基准论证
为了解释信托论证,我们首先举一个简单的例子。假设我们估计平均值
θ
变量上具有单位方差的正态分布
x
。 我们采集样本
s
由测量组成
x
1
,,,,
x
2
,,,,
……
x
n
。 最大似然估计量
θ
是平均值
x
我
,那是,
^
θ
((
s
)
=
Σ
我
x
我
/
n
。 在假设真实值下
θ
然后我们就得到了估计量的正态分布
^
θ
((
s
)
,以真实值为中心并带有方差
1
/
√
n
值得注意的是,该分布对于所有值都具有相同的形状
θ
正因为如此,费舍尔认为,我们可以使用估计量的分布
^
θ
((
s
)
作为真实值分布的替代
θ
。由此我们推导出一个概率分布
p
((
θ
)
根据样本
s
,似乎没有假设先验概率。
有几种方法可以澄清这种所谓的基准论证。一种方法采用所谓的函数模型,即通过特定函数来指定统计模型。对于上述模型,函数为
f
((
θ
,,,,
ε
)
=
θ
+
ε
=
^
θ
((
s
)
。
它关联可能的参数值
θ
到基于样本的数量,在这种情况下是观测值的估计器
^
θ
。两者通过随机分量相关
ε
其分布是已知的,并且对于所考虑的所有样本都是相同的。在我们的情况下
ε
服从正态分布,有方差
1
/
√
n
。 重要的是,分布
ε
对于每个值都是相同的
θ
。 函数的解释
f
现在可能已经很明显了。相对于值的选择
θ
,从而得到角色的真实值
θ
⋆
,分布超过
ε
规定了估计函数的分布
^
θ
((
s
)
。
现在可以简洁地表达基准论证的想法。它将随机分量的分布投影回可能的参数值。关键的观察结果是函数关系
f
((
θ
,,,,
ε
)
是平滑可逆的,即函数
f
-
1
((
^
θ
((
s
)
,,,,
ε
)
=
^
θ
((
s
)
-
ε
=
θ
点的每个组合
^
θ
((
s
)
和
ε
到唯一的参数值
θ
因此,我们可以反转上一段的主张:相对于固定一个值
^
θ
,分布超过
ε
完全决定了分布
θ
因此,借助反函数模型,我们可以将正态分布传递给
ε
到价值观
θ
大约
^
θ
((
s
)
这产生了参数上所谓的基准概率分布
θ
。获得分布是因为以估计器的值,参数和随机项的为条件是完全相关的。然后,对后者的分布自动适用于前者(参见Haenni等,52-55和119-122)。
解释相同想法的另一种方式调用了关键数量的概念。由于如何建立上述统计模型,我们可以构建关键数量
^
θ
((
s
)
-
θ
。我们知道该数量的分布,即正常和上述方差的分布。此外,此分布与样本无关,因此将样品固定到
s
,然后确定价值
^
θ
,独特地确定参数值的分布
θ
。因此,基准参数使我们能够基于观察到的样本在参数值上构建概率分布。只要我们可以像这样构造一个关键数量,或者,只要我们可以将统计模型作为功能模型表达,就可以运行该参数。
在这里有警告。正如上述许多参考文献中所揭示的那样,基准论点是高度争议的。数学结果存在,但是对结果的正确解释仍在讨论中。为了适当地欣赏精确的推论移动及其摇摆的概念基础,考虑使用基准概率在解释置信区间时,将是有益的。对此的正确理解需要首先阅读第3.1.2节。
回想一下,通常会在认识论上解释置信区间,以表明估计的质量。 95%的置信区间通常被误解为包括95%概率的真实值的参数值范围,即所谓的信用间隔:
p
((
θ
ε
[
^
θ
-
δ
,,,,
^
θ
+
δ
这是给出的
)
=
0.95
。
这种解释与经典的统计数据不一致,但是很明显,它可以通过基准论证的应用来激发。说我们替换确定尺寸的积分
δ
以下置信区间以下内容:
∫
^
θ
((
s
)
+
δ
^
θ
((
s
)
-
δ
p
θ
((
r
^
θ
((
s
)
)
d
θ
=
0.95
。
用语言,我们修复了估算器
^
θ
((
s
)
然后在参数上集成
θ
在
p
θ
((
r
^
θ
((
s
)
)
,而不是假设
θ
⋆
然后集成参数
τ
在
r
τ
。确定我们可以计算此积分。但是,是什么确保我们可以将积分视为概率?请注意,它经历了概率分布的连续性,并且没有理由认为这些术语
p
θ
((
r
^
θ
((
s
)
)
加起来适当的分布
θ
。
基准论点的假设在此解释了功能模型的可逆性,确保术语确实加起来,并且表现良好的分布将浮出水面。我们可以以示例统计量的方式选择统计模型
^
θ
((
s
)
和参数
θ
以正确的方式相关:相对于参数
θ
,我们对统计数据有分配
^
θ
,但同样,我们相对于此统计量具有分布的参数。结果,概率函数
p
θ
((
r
^
θ
((
s
)
+
ε
)
超过
ε
,在哪里
θ
固定,可以转移到基准概率函数
p
θ
+
ε
((
r
^
θ
((
s
)
)
超过
ε
,在哪里
^
θ
((
s
)
是固定的。功能
p
θ
((
r
^
θ
)
参数
θ
因此,是一个适当的概率函数,可以从中构建信用间隔。
即使那样,尚不清楚为什么我们应该将此分布作为我们信仰的适当表达,以便我们可以支持对置信区间的认知解释。因此,辩论仍在继续。最终,最好将基准的概率理解为古典和贝叶斯对统计的观点之间的中途房屋。经典统计数据是从概率的常见主义解释中得出的,因此,经典统计方法中出现的概率都被解释为事件的频率。显然,不能以这种方式解释由基准论点产生的假设的概率分布,因此对该分布的认知解释似乎是唯一的选择。几位作者(例如Dempster 1964)指出,从贝叶斯的角度来看,基金的概率确实是最有意义的。从这个角度来看,我们现在转向。
4。贝叶斯统计
贝叶斯统计方法通常以推理的形式提出。该推论是从统计假设上所谓的先前概率分布进行的,该假设表达了在收集数据之前对假设的信念程度,即对假设的后验概率分布,该假设表达了在数据纳入数据后的信念。后验分布通过概率理论的公理,从先前的分布和可能获得的数据的假设的可能性,即假设分配给数据的概率。因此,贝叶斯方法采用数据来调节我们对指定的统计假设集的态度,在这方面,它们的实现与经典统计程序相同。两种类型的统计数据都对归纳问题产生了回应。但是,尽管经典过程从一组假设中选择或消除元素,但贝叶斯方法表达了数据在后验概率分配中的影响。该后验由假设的先验和可能性通过概率理论的形式主义确定。
贝叶斯统计的定义特征在于,它考虑了统计假设和数据上的概率分布。它全心全意地包含对概率的认识论解释:假设的概率被解释为信仰程度,即是认知不确定性的表达。贝叶斯统计的哲学与确定这些输入成分的适当解释以及概率本身的数学形式形式,最终是为了证明输出合理。请注意,贝叶斯统计方法的一般模式是累积意义上的归纳主义:在数据的影响下,我们转向对假设的越来越多的知情概率观点。但是,在下文中,贝叶斯方法似乎也可能被理解为自然界的推论主义者。
4.1推理的基本模式
贝叶斯推论始终从统计模型(即一组统计假设)开始。虽然推断的一般模式是相同的,但我们分别以有限的数量和一个有限的假设来处理模型,并分别通过假设检验和估计来划出相似之处。该博览会主要基于Press 2002,Howson和Urbach 2006; Gelman等人2013和Earman 1992。
4.1.1有限模型
贝叶斯方法的中心是概率理论的定理,称为贝叶斯定理。相对于假设的先前概率分布以及每个假设的样本空间上的概率分布,它告诉我们假设的后验概率是多少。更准确地说,让
s
是样本,
s
像以前一样成为样本空间,然后
米
=
{
小时
θ
:
θ
ε
θ
}
是统计假设的空间,
θ
参数值的空间。功能
p
是整个空间上的概率分布
米
×
s
,这意味着每个元素
小时
θ
与自己的样品空间相关联
s
,以及其自身在该空间上的概率分布。对于由假设的可能性完全确定的后者,我们写下了样本的概率,在假设上有条件的假设,
p
((
s
∣
小时
θ
)
。这与表达式不同
p
小时
θ
((
s
)
,在古典统计的背景下编写,因为与古典统计学家相反,贝叶斯人接受
小时
θ
作为概率分布的论点。
首先在有限的假设的背景下引入贝叶斯统计数据,此后提供了对无限情况的概括。假设先前的概率
p
((
小时
θ
)
在假设上
小时
θ
ε
米
。进一步假设可能性
p
((
s
∣
小时
θ
)
,即分配给数据的概率
s
在假设上有条件
小时
θ
。然后贝叶斯定理确定
p
((
小时
θ
∣
s
)
=
p
((
s
∣
小时
θ
)
p
((
s
)
p
((
小时
θ
)
。
贝叶斯统计数据输出后验概率分配,
p
((
小时
θ
∣
s
)
。这种表达得出了关于关于的意见的解释
小时
θ
样品之后
s
已经记录了可容纳的,即这是一种修订的意见。贝叶斯推论的进一步结果均可从统计假设上的后验分布中得出。例如,我们可以使用后部来确定参数的最可能的值,即选择假设
小时
θ
为此
p
((
小时
θ
∣
s
)
是最大的。
在这种表征贝叶斯统计推断数据的可能性
p
((
s
)
不是前提,因为它可以根据总概率定律从先验和可能性计算,
p
((
s
)
=
Σ
θ
ε
θ
p
((
小时
θ
)
p
((
s
∣
小时
θ
)
。