归纳问题

到目前为止,我们已经考虑了概率论点,该论点将假设在假设空间和观察中的概率置于假设中。 还有一种尝试确定我们应该在所有可观察变量的联合概率分布的起点出发点到达哪些概率分布。 然后可以将公理直接假设在该分布上的可观察到,并检查预测分布的后果。 归纳逻辑的大部分发展,包括Carnap的有影响力的程序,以这种方式进行(Carnap 1950,1952)。

这种方法有助于澄清概率模型背后的假设的作用。 一个人假设一个人可以做出观察,他们是“可更换的”。 这意味着随机变量的联合分布在排放下不变。 非正式地,这意味着观测的顺序不会影响概率。 例如,在URN案例中,这意味着绘制第一白球,然后是黑球就像首先画一个黑色,然后是一个白色。 De Finetti证明了一般表示定理,如果假设无限序列的无限变量的联合概率分布是可交换的,则可以作为分布函数的混合来写入,其中数据表现得像是独立的随机抽取一样(de Finetti 1964)。 在URN示例的情况下,定理表明,从参数上的二项式分布是独立的随机抽取的

θ

,它本身具有先验的概率分布。

可交换性的假设可能被视为休谟假设过去类似于未来的自然形式化。 这是直观的,因为假设交换性意味着认为过去和未来的观察顺序对概率分配无关紧要。

然而,感应逻辑计划的发展透露了许多概括是可能的。 例如,约翰逊建议假设他称之为“足以假设”的公理。 这表明结果可以是许多不同类型的,并且下一个结果是I类型的条件概率仅取决于先前试验的数量和I类型I类型的先前结果的数量(Johnson 1932)。 假设三种以上的足够假设3种或更多种引起了与Carnap的“归纳方法连续”相对应的一般预测分布(Carnap 1952)。 这种预测分配采取表格:

p

一世

|

n

1

n

2

...

n

t

=

n

一世

+

k

n

1

+

n

2

+

+

n

t

+

k

t

|

1

2

...

=

+

1

+

2

+

+

+

对于一些正数k。 这减少了Laplace的继任法则

t

=

2

=

2

k

=

1

=

1

已经探讨了可交换性概念的概念,例如“部分交换性”和“马尔可夫交换性”,这些可能被认为是对称假设的形式(Zabell 1988; Skyrms 2012)。 假设可观察到的概率的限制性公理较少,结果是对预测的概率不再存在唯一的结果,而是通过诸如上述诸如上述概括的连续规则来映射的全类可能的概率。 因此,在这个传统中,如在贝叶斯拉普拉斯特的方法中,我们已经迁离了产生一个对休谟问题的先验概率答案的争论。

然后,人们可以认为先前的分配或可观察概率分布的相关的相应假设,正是在经验假设进入归纳推论的地方。 概率计算是经验论据,而不是先验的计算。 如果这是正确的,那么概率框架尚未到终提供了一个先验的解决方案对归纳问题的先验解决方案,但它相当允许我们澄清休谟索赔的归纳推论依赖于均匀性原则的意义。

3.4部分解决方案

有些人认为虽然没有解决诱导问题,但是有些感觉是一种部分解决方案,这被称为“逻辑解决方案”。 例如,豪森认为,“归纳推理是合理的,因为它是合理的,鉴于适当的房地”(Howson 2000:239,他的重点)。 根据这个观点,没有逃离归纳推断的经验前提,但我们仍然认为贝叶斯调理如同一种逻辑或“一致性约束”,“一致性约束”,它“从假设和观察结果中生成预测”(Romeijn 2004:360)。 一旦我们有经验假设,在现有概率中实例化,以及观察结果,贝叶斯调理会告诉我们所产生的预测概率分布应该是什么。

部分解决方案的想法也出现在当代机器学习的学习理论的背景下。 机器学习是计算机科学的一个领域,涉及从经验中学习的算法。 示例是可以训练以识别或对数据中的模式进行识别的算法。 学习理论涉及发现数学定理,该定理保证了在实际使用中的算法的性能。 在该域中,有一个众所周知的发现,如果它们具有“归纳偏差”,则学习算法仅有效 - 即,如果它们对其上采用的域进行了一些先验的假设(Mitchell 1997)。

这个想法也是如此被称为“无午餐定理”(Wolpert 1992,1996,1997)的正式表达。 这些可以被解释为Hume的第一个叉子的参数的版本,因为它们确定了算法中没有矛盾的矛盾,因为它没有先验的可能情况(Sterkenburg和Grünwald2021:9992)。 鉴于Hume的前提P3,这条规定了良好表现的示范性论证。

前提P3可能会对理由挑战,以至于还可以获得特遣队的主题理由。 尽管在一些可能的情况下,归纳推理可能会失败,但如果我们在所有可能性同样传播信任,并且有理由思考(或至少没有理由怀疑)归纳推理的情况,它仍然是合理的不可靠需要“非常具体的东西”,从而形成一小部分可能性的可能性空间(白色2015)。 自由午餐定理对这种方法产生了困难,因为如果我们对未来事件的所有逻辑上可能的序列进行了统一分布,则预期任何学习算法都有1/2的泛化误差,因此不要比猜测更好(Schurz 2021b)。

当这些算法被视为“纯粹的数据驱动”时,无午餐定理可能被视为对学习算法的基本限制 - 这是从可能数据到结论的映射。 然而,也可以认为学习算法不仅是输入数据的功能,还可以被认为是特定模型(Sterkenburg和Grünwald2021)。 例如,贝叶斯“算法”给出了占用特定模型的通用配方,并在数据上更新。 学习理论中的许多定理提供了普遍保证这些食谱的履行。 例如,存在保证贝叶斯算法的融合的定理(GHOSAL,GHOSH和VAN DER VAART 2000,GHOSAL,LEUMEN和VAN DER VAART 2008)。 在每个实例化中,这种收敛性是相对于特定的特定的。 因此,虽然由休谟首次提出的考虑因素,后来在无午餐定理中实例化,但排除了对学习算法的任何普遍模型独立的理由,但它并没有以先验的“模型相对”学习的形式排除部分理由保证(Sterkenburg和Grünwald2021)。

3.5组合方法

替代尝试使用概率推理来产生对感应推断的先验理由是所谓的“组合”解决方案。 这首先由Donald C. Williams(1947)提出,后来由David Stove(1986年)开发。

与贝叶斯拉普拉斯特的论点一样,解决方案严重依赖于直接先验计算的想法可以在“直接推理”中,从人口到样本。 如我们所见,给出某种人口频率,可以基于概率微积分的规则直接计算出样品中获得不同频率的概率。 贝叶斯拉普拉斯特的论点依赖于使用贝叶斯规则反映概率分布,从采样分布到后部分布。 威廉姆斯(威廉姆斯)推动逆推断可以基于某个逻辑三段论:比例(或统计)三段论。

比例或统计三段论如下:

所有的东西都是

/

n

/

是p.

a是m

因此,a是p,具有概率

/

n

/

例如,如果人口中的90%的兔子是白色的,我们观察兔A,那么比例三段论说,我们推断出一个白色的概率为90%。 威廉姆斯认为,比例三段论是一个非演绎逻辑三段论,有效地翻讨了意外的三段论

所有MS都是p

a是m

因此,A是P.

和矛盾的三段论

没有m是p

a是m

因此,A不是P.

该三段论可以与关于越来越大的样品行为的观察结合。 根据采样分布的计算,可以表明,随着样本大小的增加,样本频率在近似群体频率的范围内的概率也增加。 事实上,Bernoulli的大量定律指出了样品频率近似的概率近似于样品大小到无穷大的概率。 威廉姆斯认为,这种结果支持“全部内部前提,所有档案共同,样本”匹配“他们的人口”(威廉姆斯1947:78)。

然后,我们可以将比例三段论应用于来自人口的样本,以获得以下论点:

大多数样本与他们的人口相匹配

s是一个样本。

因此,S匹配其人口,概率很高。

这是比例三段论的一个实例,它使用了关于样本匹配群体的一般结果作为第一主要前提。

下一步是争辩说,如果我们观察到样本包含比例的

/

n

/

FS,然后我们可以得出结论,由于这种具有高概率的样本与其群体匹配,群体具有高概率,具有近似样本频率的人口频率

/

n

/

。 威廉姆斯和炉子都声称这增加了对归纳问题的逻辑优先解决方案。

许多作者表达了威廉姆斯 - Stove参数的视图,如果样本S从可能的样本 - 即I.E的群体随机绘制,那么任何样本都可能被绘制为任何其他样本(Brown 1987; 1948年将1948年; Giaquinto; GiaQuinto 1987)。 有时,这是对对比例三段论的应用的反对意见。 索赔是,如果从女士人口随机绘制的比例三段论仅是有效的。然而,响应已经没有必要知道样本是随机绘制的,以便应用三段论(Maher 1996; Campbell 2001; Campbell&富兰克林2004)。 当然,如果您有理由认为您的采样程序更有可能比其他人绘制某些个人 - 例如,如果您知道您在某个位置的某个位置,那么您不应该应用比例三段。 但如果你没有这样的原因,捍卫者索赔,应用它是非常合理的。 当然,您可以始终绘制一个不成绩的样本 - 意味着样本频率与人口频率不匹配的少数样本之一 - 但这就是结论仅可能并且不确定的原因。

该参数中的更显成问题是最终步骤,该步骤从我们联系我们的声明,其中样本与已经看到特定样本频率的要求的具有高概率的群体,其中绘制的群体具有靠近具有高概率的样本频率的频率。 这里的问题在于“高概率”是一种微妙的转变,它是“高概率”的含义,这已经形成了伯努尔定理的共同误读的基础。 黑客(1975:156-59)按以下条款置于以下条款。 Bernouilli的定理授权了许多频率的索赔,样本频率的小间隔将包括真正的人口频率。 换句话说,在“通常是正确的”的意义上是非常可能的,说样本与其人口相匹配。 但这并不意味着在样本周围的小间隔含有真正的人口频率的命题在“每次使用时可信”的意义上很可能。 这意味着对于任何给定的样本,样品与其人口相匹配是非常可信的。 它与声称“通常是对”的声明相当兼容,即样本与其人口匹配,说有一些样品根本不符合他们的人群。 因此,对于任何给定的样本频率,我们不能从Bernouilli的定理得出结论,我们应该将高概率分配给样本频率周围的小间隔的命题将包含真正的人口频率。 但这正是威廉姆斯在他的论点的最后一步中的幻灯片。 Maher(1996)以类似的方式辩称,威廉姆斯炉剧中的最后一步是谬误。 事实上,如果一个人想要得出关于样品频率的人口频率的概率的结论,那么正确的方法是通过使用前一节中描述的贝叶斯方法。 但是,正如我们所看到的那样,这需要分配现有概率,这解释了为什么许多人认为组合解决方案以某种方式非法地预设了像漠不关量原则的假设。 事实上,威廉姆斯 - 炉子的论点并非向我们提供反转概率的替代方法,以某种方式绕过贝叶斯人所面临的所有问题。

4.解决休谟困境的第二号角

到目前为止,我们已经考虑了休谟困境的第一个角的方式。 但是当然也可以接受第二号角。

尽管霍普所说的,但是,人们可能会争辩说,尽管如此,但是以问题方式循环(我们考虑在第4.1节中考虑这种反应)。 或者,人们可能会试图争辩说可能的争论根本不是通知(第4.2节)。

4.1归纳的归纳理由

解决休谟困境的第二个号角的一种方法是拒绝前提P6,这已经排除了循环论点。 有些人认为某些类型的循环论点将为归纳推理提供可接受的理由。 由于理由本身是一种归纳的理由,这种方法通常被称为“感应性的归纳理由”。

首先,我们应该检查阻碍循环的究竟是如何出现的。 采用简单的枚举归纳推理,遵循以下模式(x):

大多数观察到的FS都是GS

因此:大多数FS都是GS。

休谟声称这种论点预先假定了统一原则(向上)。 根据地址P7和P8,该假设也需要通过参数来支持,以便对抗归纳推理是合理的。 一种自然的想法是,我们可以争论“它有效”的理由上的统一原则。 我们知道它有效,因为过去依赖它的参数的实例被发现成功。 然而,除非我们有理由认为这些论点在未来也会成功,否则这一点是不够的。 索赔必须由归纳参数提供支持:

依赖于UP的表单X的大多数论据已经成功了。

因此,表单X的大多数论据依赖于UP成功。

但是这个论点本身取决于UP,这是我们试图证明的非常假设。

正如我们在第2节所见,一些拒绝休谟的声称所有归纳推断都会提出。 然而,基于对可能的论点的归纳推理的理由的论点将导致循环不需要依赖于此索赔。 循环关注可以更普遍框架。 如果参数s依赖于推理x中已经预设的某些东西,则参数s不能用于证明推理x。这个问题是恰恰是东西。

一些作者认为,实际上S不依赖于任何前提甚至预设,这些前提是要求我们已经知道X.的结论,那么不是“前提通函”论证。 相反,他们声称,它是“规则 - 圆形” - 它依赖于推理的规则,以达到非常规则可靠的结论。 假设我们采用规则R,这表明当观察到大多数FS是GS时,我们应该推断大多数FS是GS。 然后推理X依赖于规则R.我们想显示规则R是可靠的。 我们可以吸引过去在过去工作的事实,因此,通过归纳争论,它将将来工作。 调用此参数s *:

规则R后的大多数推论都是成功的

因此,r以下的大多数推断都是成功的。

由于此参数本身使用规则R,因此使用它来确定R是可靠的,是规则循环。

一些作者然后认为,尽管前提是圆形是恶毒的,但规则循环不是(1984年的CLEVE; Papineau 1992)。 思考规则循环的一个原因是不是恶毒,如果没有必要知道或甚至合理地认为规则R是可靠的,以便使用规则转向合理的结论。 这是外部家族关于理由的索赔(1984年CLEVE)。 他们说,只要r实际上是可靠的,人们就可以在依赖r依赖r的争论结束时形成了一个合理的信念,只要一个人在房屋内有理由地信仰。

如果没有被外部家人的索赔说服,那么人们可能会试图争辩说规则循环是一种不同的时尚良性。 例如,当规则是非常基本的性质时,规则被证明没有任何规则循环的规则可以易于稳定。 当lange把它放了:

有可能建议虽然循环论证通常无法证明其结论,但在证明基本的推理形式的情况下,循环论证是可以接受的。 毕竟,转向更基本的是,我们可以合理地要求一系列基本的推理是它恳求自己。 (Lange 2011:56)

(本章完)

相关推荐