统计哲学(一)
1。统计和归纳
2。基础和解释
2.1身体概率和经典统计
2.2认知概率和统计理论
2.2.1认知概率类型
2.2.2统计理论
3。古典统计
3.1古典统计基础知识
3.1.1假设检验
3.1.2估计
3.2古典统计问题
3.2.1信念接口
3.2.2证据的性质
3.2.3游览:可选停止
3.3对批评的回应
3.3.1证据的强度
3.3.2理论发展
3.3.3游览:信托论点
4。贝叶斯统计
4.1推理的基本模式
4.1.1有限模型
4.1.2连续模型
4.2贝叶斯方法的问题
4.2.1对假设的概率的解释
4.2.2先验的确定
4.3对批评的回应
4.3.1严格但经验知情的主观主义
4.3.2游览:表示定理
4.3.3贝叶斯统计作为逻辑
4.3.4游览:感应逻辑和统计
4.3.5客观先验
4.3.6绕过先验
5。统计模型
5.1模型比较
5.1.1 Akaike的信息标准
5.1.2模型评估
5.2没有模型的统计数据
5.2.1减少数据技术
5.2.2正式学习理论
6。相关主题
参考书目
学术工具
其他互联网资源
相关条目
1。统计和归纳
统计是一种数学和概念学科,重点介绍了数据和假设之间的关系。数据是科学研究中观察结果或事件的记录,例如,一组人口的测量值。实际获得的数据被称为样本,样本数据或数据,而研究中的所有可能样本都在所谓的样本空间中收集。反过来,这些假设是关于科学研究的目标体系的一般性陈述,例如表达了有关人群中所有个人的一般事实。统计假设是一个一般语句,可以通过样本空间上的概率分布来表示,即它决定了每个可能样本的概率。
统计方法提供了数学和概念手段,以根据样本来评估统计假设。为此,该方法采用了概率理论及其概括。评估可能会决定假设的可信度,我们是否可以依靠决策中的假设,样本对假设的支持有多强大,等等。统计数据的良好介绍(例如Barnett 1999,Mood and Graybill 1974,出版社2002)。
以摘自Fisher(1935)为例,将有帮助。
品尝茶女士。
考虑一位女士声称她可以通过口味确定将牛奶和茶倒入杯子的顺序。现在想象一下,我们为她准备了五杯茶,扔了一枚公平的硬币,以确定每杯牛奶和茶的顺序。我们要求她发音订单,我们发现她在所有情况下都是正确的!现在,如果她盲目地猜测顺序,那么由于我们准备杯子的随机方式,她将有50%的时间正确回答。这是我们的统计假设,称为零假设。它的概率
1
/
2
正确猜测,因此
1
/
2
到一个不正确的。样本空间由女士可能给出的所有答案组成,即,所有一系列正确和不正确的猜测,但我们的实际数据位于这个空间中相当特殊的角落。根据我们的统计假设的假设,记录事件的可能性仅为3%或
1
/
2
5
更准确地说。以此为由,我们可能决定拒绝那位女士猜测的假设。
根据所谓的零假设检验,如果实际获得的数据包含在样本空间内的特定区域中,则必须对此决定进行决定,该区域的总概率不超过某些指定的限制,标准设置为5%。现在考虑刚刚概述的统计测试所取得的成就。我们从关于女士的实际茶品尝能力的假设开始,即她没有。在假设的假设上,我们获得的样本数据被证明是令人惊讶的,或者更确切地说,非常不可能。因此,我们决定,那位女士没有茶品尝能力的假设可以被拒绝。样本指出了关于女士可以或不能做什么的负面但一般的结论。
因此,从归纳推理中熟悉统计分析的基本模式:我们输入迄今为止获得的数据,统计过程输出了超越数据的判决或评估,即单独使用数据所不产生的陈述。如果确实认为数据是唯一的输入,并且如果将统计程序理解为推论,则统计数据与扩增性推断有关:粗略地说,我们的出现超出了我们的投入。统计数据与未来或一般事务状态有关,它们是归纳的。但是,统计数据与放大和归纳推断的关联是有争议的,这既是某些统计学被认为是非明确的(请参见第3节),也没有其他人的态度(请参阅第4节)。
尽管存在这种分歧,但将统计数据视为对归纳问题的回应是有见地的(参见Howson 2000和有关归纳问题)。休ume在他的《人性论》中首次讨论的这个问题(第一本,第3部分,第6节),但已经被像塞克斯·厄普里库斯(Sextus empiricus)这样的古代怀疑论者所预科(请参阅《古代怀疑主义》的条目),是没有适当的理由来推论。从给定的经验到对未来的期望。它已转到统计的上下文时,它说,将数据作为输入并返回判决,评估或其他一些与未来或一般事务状态有关的判决,评估或其他建议的程序没有适当的理由。可以说,统计学的许多理念是通过提供统计信息提供的程序的基础,或通过重新解释统计数据提供的以避免挑战来应对这一挑战。
统计学哲学家最终与归纳理由的精致甚至空灵的问题有关,这是有争议的。实际上,许多哲学家和科学家都接受统计的谬误,发现正确理解和应用统计方法更重要。通常情况下,基本的哲学问题是催化剂:归纳问题指导我们对统计方法的工作,正确性和适用性的调查。因此,统计学的哲学被理解为进行这些调查的一般标题,因此与短暂的问题无关,而是对科学哲学和科学本身做出了重要和具体的贡献。
2。基础和解释
尽管统计程序和推论的组织方式存在很大差异,但它们都同意使用现代测量理论概率理论(Kolmogorov)或接近亲属的方式,作为表达假设并将其与数据相关联的手段。就其本身而言,概率函数只是一种特殊的数学函数,用于表达集合的度量(参见Billingsley 1995)。
让
w
成为元素的集合
s
,并考虑最初的亚集集合
w
,例如,辛格尔顿套装
{
s
}
。现在考虑参加补充的操作
¯
r
给定集
r
:补充
¯
r
完全包含所有这些
s
不包括
r
。接下来考虑加入
r
∪
问
给定的集
r
和
问
:一个元素
s
是
r
∪
问
恰恰是
r
,,,,
问
,或两者兼而有之。补充和加入操作产生的集合的集合称为代数,表示为
s
。在统计中,我们解释
s
作为样本集,我们可以关联
r
带有特定的事件或观察。特定样本
s
包括所表示的事件记录
r
确切的时间
s
∈
r
。我们采用类似的代数
r
作为对样品提出主张的语言。
概率函数定义为代数上的加性归一化度量:一个函数
p
:
s
→
[
0
,,,,
1
这是给出的
这样
p
((
r
∪
问
)
=
p
((
r
)
+
p
((
问
)
如果
r
∩
问
=
∅
和
p
((
w
)
=
1
。条件概率
p
((
问
∣
r
)
被定义为
p
((
问
∣
r
)
=
p
((
问
∩
r
)
p
((
r
)
,,,,
每当
p
((
r
)
>
0
。它决定了集合的相对大小
问
在集合中
r
。它通常被理解为事件的概率
问
鉴于事件
r
发生。回想一下套装
r
由所有样品组成
s
其中包括与事件相关的事件记录
r
。通过看
p
((
问
∣
r
)
我们放大了此集合中的概率函数
r
,即,我们考虑相关事件发生的条件。
现在概率函数是什么意思?概率的数学概念不能提供答案。功能
p
可以解释为
物理,即发生状态的发生频率或倾向,通常称为机会,或者
认知,即对事态状况的发生的信念程度,愿意以其假设行动,一定程度的支持或确认或类似的意愿。
这种区别不应与客观和主观概率之间的区别相混淆。物理和认知的概率都可以具有客观和主观的特征,从某种意义上说,这两者都可以被视为依赖或独立于知识主题及其概念仪器。有关概率解释的更多详细信息,邀请读者咨询Galavotti(2005),Gillies(2000),Mellor(2005),von Plato(1994),Eagle的选集(2010) (即将到来的),或实际上是对概率解释的输入。在这种情况下,关键点是解释都可以与统计程序的基础程序联系起来。尽管比赛不是精确的,但上面指定的两种主要类型可以与统计的两个主要理论(古典和贝叶斯统计)相关联。
2.1身体概率和经典统计
在科学中,概率表达物理状态(通常称为机会或随机过程)的观念是最突出的。它们是一系列事件中的相对频率,或者,它们是实现这些事件的系统中的趋势或倾向。更确切地说,事件类型属性附加的概率可以理解为该属性在该类型的一系列事件中表现出的频率或趋势。例如,硬币降落头的概率正好是一系列类似的硬币折腾时,硬币将头降落在一半的时间。或者,如果在抛售硬币的设置中均具有两种可能的结果的趋势,则概率是一半。数学家维恩(1888)和像Quetelet和Maxwell(参见Von Plato 1994)这样的科学家是这种观察概率的早期支持者。倾向的哲学理论首先是由Peirce(1910)创造的,由Popper(1959),Mellor(1971),Bigelow(1977)和Giere(1976)开发。有关最近的概述,请参见Handfield(2012)。冯·米塞斯(Von Mises,1981)首先设计了一种严格的概率理论,也是由雷兴巴赫(Reichenbach,1938)捍卫的,在范·兰巴尔根(Van Lambalgen,1987)中精美地阐述了。
物理概率的概念连接到统计方法的主要理论之一,该理论已被称为经典统计。它大致是在20世纪上半叶开发的,主要是由数学家和像Fisher(1925,1935,1956),Wald(1939,1950),Neyman和Pearson(1928,1933,1933,1967)这样的数学科学家和工作科学家开发的。过去几十年来的许多古典统计学家。这种统计理论的关键特征自然与将概率视为物理机会,因此与可观察到的可重复事件有关。物理概率不能有意义地归因于统计假设,因为假设没有它们出现的趋势或频率:它们一劳永逸地是正确或错误的。将概率归因于假设似乎需要认识论读取概率。
由于经典程序中事件频率的中心性以及冯·米塞斯(Von Mises)开发的概率的频繁解释的突出性,经典统计通常被称为频繁主义者。在这种解释中,机会是一系列类似事件或项目中的频率或比例。最好将它们视为类似于其他物理量,例如质量和能量。值得强调的是,频率在概念上是在机会之前。在倾向理论中,单个事件或项目的概率被视为本质上的趋势,因此频率或一类类似事件或项目的比例表现为大量定律。相比之下,频繁的理论中的比例确实定义了机会。这导致了常见概率的中心问题,即所谓的参考类问题:尚不清楚要与单个事件或项目相关联(参见Reichenbach 1949,Hajek 2007)。有人可能会争辩说,班级需要尽可能狭窄,但是在极端的事件类别的极端情况下,当然可以琐碎的机会零为零或一个。由于经典统计数据采用了其程序中与单个情况相关的非平凡概率,因此可以说,对统计数据完全频繁地理解需要对参考类问题的响应。
为了说明身体的概率,我们在茶品尝女士的示例中简要考虑了身体概率。
身体概率
我们表示无效的假设,即那位女士只是在猜测
h
。假设我们遵循上述示例中指示的规则:我们拒绝这个无效的假设,即,每当采样数据
s
包含在特定集中
r
可能的样本,所以
s
∈
r
,那
r
根据原假设的总概率为5%。现在,想象一下,我们应该判断整个茶女士,散布在全国各地的茶室中。然后,通过运行实验并采用了刚被引用的规则,我们知道我们将错误地将特殊的茶品尝才能归因于5%的女士,而这些假设是正确的,即实际上只是在猜测。换句话说,这个百分比与特定事件集的物理概率有关,该事件通过规则与我们的判断中的特定错误有关。
现在说,我们找到了一位女士,我们拒绝了无效的假设,即通过考试的女士。她是否有茶品尝能力?不幸的是,这不是可以通过手头测试可以回答的问题。一个很好的答案可能涉及女士的比例,这些女士的比例确实超过了一定得分的人,即那些在所有五个杯子上都正确回答的女士的比例。但是,后者的比例,即,在所有通过测试的女士中,零假设是错误的女士,与通过该测试的女士的比例有所不同。这也将取决于在受到审查中具有人口能力的女士比例。相比之下,该测试仅涉及一组零假设为真假设的女士中的比例:我们只能考虑特定事件的概率,假设事件以给定方式分布。
2.2认知概率和统计理论
还有一种替代方法来查看统计方法中出现的概率:它们可以看作是认知态度的表达。我们再次面对几个相互关联的选项。非常粗略地说,认知概率可能是挑剔的,决策理论的或合乎逻辑的。
2.2.1认知概率类型
可能会概率代表毒品态度,从某种意义上说,他们对理想化理性代理的数据和假设提出了意见。然后,这种概率表达了信念的力量或程度,例如,关于茶品尝女士的下一个猜测的正确性。它们也可以作为决策理论,即作为代理人更详细代表的一部分,这决定了她对数据和假设的决策和行动的倾向。通常情况下,决策理论表示涉及优先甚至其他态度。在这种情况下,例如,概率可能表示愿意押注这位女士是正确的。最后,概率可以视为逻辑。更确切地说,概率模型可以作为逻辑,即正式表示,该形式可以确定不确定推理的规范性理想。根据后一种选项,对数据和假设的概率值具有与真实价值在演绎逻辑中的作用相媲美的作用:它们有助于确保有效推理的概念,而无需提出,即数值是在心理上指的东西。突出。
关于概率的认知观点是在19世纪和20世纪上半叶发展起来的,首先是De Morgan(1847)和Boole(1854)的手,后来由Keynes(1921)(1921年),Ramsey(1926)和De Finetti。 (1937年),以及决策理论家,哲学家和归纳逻辑学家,例如Carnap(1950),Savage(1962),Levi(1980)和Jeffrey(1992)。统计中这些观点的重要支持者是Jeffreys(1961),Edwards(1972),Lindley(1965),Good(1983),Jaynes(2003)以及最近几十年的许多贝叶斯哲学家和统计学家(例如,Goldstein,Goldstein, 2006年,Kadane 2011,Berger 2006,Dawid 2004)。所有这些都有一种观点,该观点将概率放置在认知范围的某个地方,而不是物理,即不是作为世界模型的一部分,而是作为建模像人类思想这样的代表系统的一种手段。
上述部门当然不是完整的,边缘模糊。首先,在决策理论的帮助下,概率的概率概念主要以行为主义的方式阐明。许多人已经采用了所谓的荷兰书籍论点来确切地信仰程度,并表明它确实被概率的数学理论所捕获(参见Jeffrey,1992年)。根据此类论点,对事件发生的信念程度是由投注合同的价格给出的,如果事件表现出来,该合同支付了一个货币单位。但是,这种行为主义者可以将概率视为Doxastic态度,使用准确性或靠近真理的态度。其中大多数是De Finetti(1974)提出的论点的版本或扩展。其他人则基于自然逃避程度的自然逃避程度(例如Cox 1961)开发了一种公理方法。
此外,正如上面所暗示的,在概率的概念中,我们可以将进一步的细分纳入主观和客观的诱惑态度。客观诱发概率的定义特征在于,它受到信念被校准到某些客观事实或事务状态的要求,或者是通过进一步的合理性标准。相比之下,主观的杀人态度并没有以这种方式受到限制:从规范的角度来看,只要它们符合概率公理,代理就可以自由地相信它们。