哲学(一)

1. 统计与归纳

2. 基础和解释

2.1 物理概率与经典统计

2.2 认知概率和统计理论

2.2.1 认知概率的类型

2.2.2 统计理论

3. 经典统计

3.1 经典统计基础知识

3.1.1 假设检验

3.1.2 估算

3.2 经典统计问题

3.2.1 与信念的接口

3.2.2 证据的性质

3.2.3 游览:可选停止

3.3 对批评的回应

3.3.1 证据的强度

3.3.2 理论进展

3.3.3 偏差:基准论证

4. 贝叶斯统计

4.1 推理的基本模式

4.1.1 有限模型

4.1.2 连续模型

4.2 贝叶斯方法的问题

4.2.1 假设概率的解释

4.2.2 先验的确定

4.3 对批评的回应

4.3.1 严格但基于经验的主观主义

4.3.2 偏差:表示定理

4.3.3 作为逻辑的贝叶斯统计

4.3.4 拓展:归纳逻辑和统计

4.3.5 客观先验

4.3.6 规避先验

5. 统计模型

5.1 模型比较

5.1.1 赤池信息准则

5.1.2 模型的贝叶斯评估

5.2 没有模型的统计

5.2.1 数据缩减技术

5.2.2 形式学习理论

6. 相关主题

参考书目

学术工具

其他互联网资源

相关条目

1. 统计与归纳

统计学是一门数学和概念学科,专注于数据和假设之间的关系。数据是科学研究中观察或事件的记录,例如对人群中个体的一组测量。实际获得的数据被称为样本、样本数据或简称为数据,研究中所有可能的样本都被收集在所谓的样本空间中。反过来,假设是关于科学研究目标系统的一般性陈述,例如,表达关于总体中所有个体的一些一般事实。统计假设是可以通过样本空间上的概率分布来表达的一般陈述,即,它确定每个可能样本的概率。

统计方法提供了根据样本评估统计假设的数学和概念方法。为此,该方法采用概率论及其概括。评估可以确定假设的可信度、我们的决策中是否可以依赖该假设、样本对假设的支持有多强等等。关于统计学的优秀介绍比比皆是(例如,Barnett 1999、Mood and Graybill 1974、Press 2002)。

从费舍尔 (Fisher, 1935) 中获取一个例子将会有所帮助。

品茶小姐。

假设有一位女士声称她可以通过口味确定牛奶和茶倒入杯子的顺序。现在想象一下,我们为她准备了五杯茶,并掷一枚硬币来确定每杯中牛奶和茶的顺序。我们让她说出顺序,我们发现她在所有情况下都是正确的!现在,如果她盲目猜测顺序,由于我们准备杯子的方式是随机的,她的回答正确率是 50%。这是我们的统计假设,称为原假设。它给出了概率

1

/

2

正确的猜测,因此概率

1

/

2

到一个不正确的。样本空间由女士可能给出的所有答案字符串组成,即所有一系列正确和错误的猜测,但我们的实际数据位于这个空间中一个相当特殊的角落。根据我们的统计假设,记录事件的概率仅为 3%,或者

1

/

2

5

更准确地说。基于此,我们可以决定拒绝这位女士正在猜测的假设。

根据所谓的零假设检验,如果实际获得的数据包含在样本空间内的特定区域中,并且其总概率不超过某个指定限制(标准设置为 5%),则这样的决定是有道理的。现在考虑一下刚才概述的统计测试所取得的成果。我们首先假设这位女士的实际品茶能力,即她没有任何品茶能力。根据这一假设,我们获得的样本数据结果令人惊讶,或者更准确地说,极不可能。因此,我们决定拒绝该女士没有任何品茶能力的假设。该样本向我们指出了关于这位女士可以做什么或不能做什么的负面但笼统的结论。

因此,统计分析的基本模式与归纳推理很相似:我们输入迄今为止获得的数据,统计过程输出超越数据的结论或评估,即不仅仅由数据所蕴含的陈述。如果数据确实被认为是唯一的输入,并且如果统计过程被理解为推论,那么统计就与放大推论有关:粗略地说,我们得到的比我们投入的多。统计数据涉及未来或一般事态,它们是归纳性的。然而,统计与放大和归纳推理的关联是有争议的,因为有些人认为统计是非推理的(见第 3 节),而另一些人则认为统计是非放大的(见第 4 节)。

尽管存在这些分歧,将统计视为对归纳问题的回应是富有洞察力的(参见 Howson 2000 和归纳问题的条目)。这个问题首先由休谟在他的《人性论》(第一卷,第 3 部分,第 6 节)中讨论,但已经由像塞克斯图斯·经验派(Sextus Empiricus)这样的古代怀疑论者预示(见古代怀疑论的条目),即推论没有适当的理由。从给定的经验到对未来的期望。转换到统计学的背景下,它指出,以数据作为输入并返回判决、评估或与未来或一般事态有关的其他建议的程序没有适当的理由。可以说,统计学的大部分哲学都是为了应对这一挑战,通过为统计学提供的程序提供基础,或者通过重新解释统计学提供的内容来逃避挑战。

统计哲学家最终关心的是归纳论证的微妙甚至空灵的问题,这是有争议的。事实上,许多哲学家和科学家都承认统计学的错误性,并发现正确理解和应用统计方法更为重要。正如通常的情况一样,基本的哲学问题充当了催化剂:归纳问题指导我们对统计方法的运作、正确性和适用条件的研究。因此,统计哲学被理解为进行这些调查的总标题,它并不关心短暂的问题,而是对科学哲学和科学本身做出了至关重要和具体的贡献。

2. 基础和解释

虽然统计程序和推论的组织方式存在很大差异,但他们都同意使用现代测度论概率论(柯尔莫哥洛夫)或近亲作为表达假设并将其与数据联系起来的手段。就其本身而言,概率函数只是一种特殊的数学函数,用于表达集合的度量(参见 Billingsley 1995)。

是一个包含元素的集合

s

,并考虑子集的初始集合

,例如,单例集

{

s

}

。现在考虑取补集的操作

给定集合的

: 补语

确切地包含所有这些

s

不包括在

。接下来考虑加入

给定集合

:一个元素

s

是的成员

正是当它是以下成员时

,

,或两者兼而有之。由补集和连接运算生成的集合的集合称为代数,表示为

S

。在统计学中我们解释

S

作为样本集,我们可以将集合关联起来

具有特定事件或观察结果。具体样本

s

包括用 表示的事件记录

恰好在什么时候

s

ε

。我们采用集合的代数,例如

作为对样本做出声明的语言。

概率函数被定义为代数上的加性归一化测度:函数

S

[

0

,

1

]

这样

=

+

如果

=

=

1

。条件概率

定义为

=

,

每当

>

0

。它决定了集合的相对大小

集合内

。它通常被解读为事件发生的概率

鉴于该事件

发生。回想一下,集合

由所有样本组成

s

包括与相关事件的记录

。通过查看

我们放大这个集合中的概率函数

,即我们考虑关联事件发生的条件。

那么概率函数是什么意思呢?概率的数学概念没有提供答案。功能

可以解释为

物理的,即某种情况发生的频率或倾向,通常称为机会,或者称为

认知,即对事态发生的相信程度、根据其假设采取行动的意愿、支持或确认的程度或类似程度。

这种区别不应与客观概率和主观概率之间的区别相混淆。物理概率和认知概率都可以被赋予客观和主观的特征,从某种意义上说,两者都可以被视为依赖于或独立于认知主体及其概念装置。有关概率解释的更多详细信息,请读者查阅 Galavotti (2005)、Gillies (2000)、Mellor (2005)、von Plato (1994)、Eagle 的选集 (2010)、Hajek 和 Hitchcock 的手册(即将出版),或者实际上是概率解释的条目。在这种情况下,关键点是所有解释都可以与统计程序的基础程序联系起来。尽管匹配并不精确,但上面指定的两种主要类型可以分别与经典统计和贝叶斯统计这两种主要统计理论相关联。

2.1 物理概率与经典统计

在科学中,概率表达事物的物理状态(通常称为机会或随机过程)的观点最为突出。它们是一系列事件中的相对频率,或者,它们是实现这些事件的系统中的趋势或倾向。更准确地说,事件类型属性的概率可以理解为该属性在该类型的一系列事件中出现的频率或趋势。例如,当在一系列类似的抛硬币中,硬币正面朝上的概率是一半时,硬币正面朝上的概率是一半。或者,如果在抛硬币的设置中两种可能结果的趋势均等,则概率为一半。数学家维恩(Venn,1888)以及奎特莱和麦克斯韦(参见冯·柏拉图,1994)等科学家是这种看待概率的方式的早期支持者。倾向的哲学理论首先由 Peirce (1910) 创造,并由 Popper (1959)、Mellor (1971)、Bigelow (1977) 和 Giere (1976) 发展;有关最新概述,请参阅 Handfield (2012)。冯·米塞斯 (von Mises) (1981) 首先提出了严格的概率作为频率的理论,也得到了赖兴巴赫 (Reichenbach) (1938) 的辩护,并在范·兰巴尔根 (van Lambalgen) (1987) 中进行了精彩的阐述。

物理概率的概念与统计方法的主要理论之一相关,该理论被称为经典统计。它大约是在 20 世纪上半叶开发的,主要是由费舍尔(Fisher,1925、1935、1956)、沃尔德(Wald,1939、1950)、内曼和皮尔逊(Neyman 和 Pearson,1928、1933、1967)等数学家和工作科学家开发,并由过去几十年来很多经典的统计学家。这种统计理论的关键特征自然地与将概率视为物理机会相一致,因此涉及可观察和可重复的事件。物理概率不能有意义地归因于统计假设,因为假设没有出现的趋势或频率:它们绝对是真或假,一劳永逸。将概率归因于一个假设似乎需要从认识论上解读概率。

由于事件频率在经典程序中的中心地位以及冯·米塞斯对概率的频率论解释的突出地位,古典统计学通常被称为频率论。在这种解释中,机会是一类相似事件或项目中的频率或比例。最好将它们视为与质量和能量等其他物理量类似。值得强调的是,频率在概念上优先于机会。在倾向理论中,单个事件或项目的概率被视为本质上的趋势,因此一类相似事件或项目的频率或比例表现为大数定律的结果。相比之下,在频率论中,所规定的比例实际上定义了机会是什么。这导致了频率论概率的一个核心问题,即所谓的参考类问题:不清楚哪个类与单个事件或项目相关联(参见 Reichenbach 1949,Hajek 2007)。有人可能会争辩说,类别需要尽可能缩小,但在单一类别事件的极端情况下,概率当然会微不足道到零或一。由于经典统计在其过程中采用了与单个案例相关的非平凡概率,因此对统计的完全频率论理解可以说需要对参考类问题的响应。

为了说明物理概率,我们以品茶女士的例子来简要考虑物理概率。

物理概率

我们将这位女士只是猜测的零假设表示为

小时

。假设我们遵循上面例子中指出的规则:我们拒绝这个零假设,即否认这位女士只是猜测,每当采样数据

s

包含在特定集合中

可能的样本数,所以

s

ε

,还有那个

根据原假设,总概率为 5%。现在想象一下,我们要评判分散在全国各地茶室里的所有品茶女士。然后,通过进行实验并采用刚才引用的规则,我们知道我们会错误地将特殊的品茶天赋归因于零假设成立的 5% 的女士,即实际上只是猜测。换句话说,这个百分比与一组特定事件的物理概率有关,按照规则,它与我们判断中的特定错误有关。

现在假设我们找到了一位女士,我们拒绝她的零假设,即一位通过测试的女士。她有品茶能力吗?不幸的是,这不是当前测试可以回答的问题。一个好的答案大概涉及那些分数超过一定阈值的女性中,确实具有特殊品茶能力的女性的比例,即在所有五个杯子上都回答正确的女性。但后一个比例,即所有通过测试的女性中原假设为假的女性比例,与原假设为假的女性中通过测试的女性比例不同。这还取决于受审查人口中有能力的女性比例。相比之下,该检验仅涉及零假设成立的一组女性中的比例:我们只能在假设事件以给定方式分布的情况下考虑特定事件的概率。

2.2 认知概率和统计理论

还有另一种方式来看待统计方法中出现的概率:它们可以被视为认知态度的表达。我们再次面临几个相互关联的选择。粗略地说,认知概率可以是信念性的、决策论性的或逻辑性的。

2.2.1 认知概率的类型

概率可以被用来代表信念态度,因为它们指定了关于理想化理性主体的数据和假设的观点。然后,概率表示信念的强度或程度,例如关于品茶女士的下一次猜测的正确性。它们也可以被视为决策理论,即作为代理更详细表示的一部分,这决定了她对数据和假设的决策和行动的倾向。通常,决策理论的表述涉及信仰态度以及偏好态度和其他态度。在这种情况下,概率可以表示愿意打赌这位女士是正确的。最后,概率可以被认为是合乎逻辑的。更准确地说,概率模型可以被视为一种逻辑,即为不确定推理确定规范理想的形式表示。根据后一种选择,数据和假设的概率值的作用与演绎逻辑中真值的作用相当:它们用于确保有效推理的概念,而不带有数值在心理上指代任何事物的建议。突出。

概率的认识论观点在十九世纪和二十世纪上半叶得到发展,首先由德·摩根(De Morgan,1847)和布尔(Boole,1854)提出,后来由凯恩斯(Keynes,1921)、拉姆齐(Ramsey,1926)和德菲内蒂提出。 (1937),以及决策理论家、哲学家和归纳逻辑学家,如 Carnap (1950)、Savage (1962)、Levi (1980) 和 Jeffrey (1992)。这些统计学观点的重要支持者有 Jeffreys (1961)、Edwards (1972)、Lindley (1965)、Good (1983)、Jaynes (2003) 以及过去几十年的许多贝叶斯哲学家和统计学家(例如 Goldstein) 2006 年,Kadane 2011 年,Berger 2006 年,Dawid 2004 年)。所有这些观点都认为概率将概率置于认知领域而不是物理领域,即不是作为世界模型的一部分,而是作为模拟人类思维等表征系统的手段。

上面的划分肯定是不完整的,而且边缘是模糊的。其一,概率的迷信概念大多是在决策理论的帮助下以行为主义的方式阐明的。许多人采用了所谓的荷兰书论来使置信度变得精确,并表明它确实被概率的数学理论所捕获(参见 Jeffrey 1992)。根据这些论点,对事件发生的信任程度由投注合同的价格决定,如果该事件发生,该合同将支付一个货币单位。然而,除了这种将概率视为迷信态度的行为主义者之外,还有其他选择,即使用准确性或接近事实。其中大多数都是 de Finetti (1974) 提出的论点的版本或扩展。其他人已经开发了一种基于对信仰程度的自然需求的公理化方法(例如,Cox 1961)。

此外,正如上面提到的,在概率的信念概念中,我们可以进一步细分为主观和客观信念态度。客观信念概率的定义特征是,它受到信念根据某些客观事实或事态进行校准的要求的限制,或者受到进一步的理性标准的限制。相比之下,主观信念态度则不受这种方式的限制:从规范的角度来看,主体可以自由地相信他们认为合适的东西,只要他们遵守概率公理。

(本章完)

相关推荐