逻辑与概率(二)

因此,定理 2 的弱点在于它考虑了不相关或无关紧要的前提(的不确定性)。为了获得该定理的改进版本,需要更细粒度的“本质”概念。在上例中的论证 A 中,前提 s 是完全不相关的。类似地,前提 p 是绝对相关的,因为没有这个前提,结论 p∧(q∨r) 就不再可推导。最后,前提子集 {q,r} 是“介于两者之间”:q 和 r 一起是相关的(如果两个前提都被省略,则结论不再可导),但它们中的每一个都可以单独省略(同时保持可得出结论)。

本质性的概念形式化如下:

基本前提设定。给定一个有效的参数 (Г, ψ),当且仅当 Г− Г′⊭ ψ 时,集合 Т′⊆Ч 是必要的。

本质程度。给定一个有效的参数 (Г,ψ) 和一个前提 γ ∈ Г,γ 的本质性程度,写作 E(γ),为 1/|Sγ|,其中 |Sγ|是包含 γ 的最小本质前提集的基数。如果γ不属于任何最小本质前提集,则γ的本质度为0。

通过这些定义,可以建立定理 2 的精炼版本:

定理 4. 考虑一个有效的论证 (Г,ψ)。则结论 的不确定性不能超过前提 γ ε 的不确定性的加权和,以本质程度为权重。正式:

U(φ)≤

Σ

γ ε γ

E(γ)U(γ)。

定理 4 的证明比定理 2 的证明要困难得多:定理 2 仅需要基本的概率论,而定理 4 则使用线性规划方法进行证明(Adams 和 Levine 1975;Goldman 和 Tucker 1956)。定理 4 将定理 2 作为一种特殊情况:如果所有前提都是相关的(即本质性程度为 1),则定理 4 产生与定理 2 相同的上限。此外,定理 4 没有考虑不相关的前提(即前提)本质性程度为 0) 来计算该上限;因此,如果一个前提与论证的有效性无关,那么它的不确定性就不会延续到结论中。最后,请注意,由于 E(γ)ε[0,1] 对于所有 γεΓ,因此成立

Σ

γ ε γ

E(γ)U(γ)≤

Σ

γ ε γ

U(γ),

即,定理 4 通常产生比定理 2 更严格的上限。为了说明这一点,请再次考虑带有前提 p,q,r,s 和结论 p∧(q∨r) 的论证。回想一下 P(p)=10/11、P(q)=P(r)=9/11 和 P(s)=7/11。我们可以计算前提的本质程度:E(p)=1,E(q)=E(r)=1/2,E(s)=0。因此定理 4 得出

U(p∧(q∨r))≤

(1×

1

11

)+(

1

2

×

2

11

)+(

1

2

×

2

11

)+(0×

4

11

)=

3

11

,

对于 p∧(q∨r) 的不确定性,这是比上面通过定理 2(即 9/11 和 5/11)获得的任何界限更严格的上限。

2.3 进一步概括

考虑到有效论证前提的不确定性(以及本质性程度),亚当斯定理允许我们计算结论不确定性的上限。当然,这些结果也可以用概率而不是不确定性来表达;然后它们得出结论概率的下限。例如,当用概率而不是不确定性表示时,定理 4 如下所示:

P(φ)≥1−

Σ

γ ε γ

E(γ)(1−P(γ))。

亚当斯的结果至少在两个方面受到限制:

它们仅提供结论概率的下限(给定前提概率)。从某种意义上说,这是最重要的界限:它代表了“最坏情况”下结论的概率,这在实际应用中可能是有用的信息。然而,在某些应用中,结论概率的上限也可能提供信息。例如,如果一个人知道这个概率的上限为 0.4,那么一个人可能会决定避免某些行动(如果这个上限是(已知)0.9,那么一个人就会执行这些行动)。

他们假设前提的确切概率是已知的。然而,在实际应用中,可能只有关于前提 γ 的概率的部分信息:其确切值未知,但已知它具有下界 a 和上限 b (Walley 1991)。在此类应用中,有一种方法可以根据前提概率的上限和下限来计算结论概率的(最佳)下限和上限。

Hailperin (1965, 1984, 1986, 1996) 和 Nilsson (1986) 使用线性规划的方法表明这两个限制是可以克服的。他们最重要的结果如下:

定理 5. 考虑一个参数 (Г, ψ),其中 |Г|=n。存在函数 LГ,Ф:R2n→R 和 UГ,Ф:R2n→R,使得对于任何概率函数 P,以下成立:如果 ai≤P(γi)≤bi 对于 1≤i≤n,则:

L , , (a1,…,an,b1,…,bn)≤P( )≤ U , , (a1,…,an,b1,…,bn)。

第 1 项中的边界是最优的,因为存在概率函数 PL 和 PU,使得 ai≤PL(γi)、PU(γi)≤bi(对于 1≤i≤n),并且

LГ, ψ(a1,…,an,b1,…,bn)=PL(ψ)

PU(Φ)=UГ,Φ(a1,…,an,b1,…,bn)。

函数 LГ,Г 和 UГ,Г 可以根据 Г∪{Г} 中句子的布尔结构有效地确定。

这个结果还可以用来定义另一种概率有效性概念,我们将其称为 Hailperin 概率有效性或简称为 h 有效性。这个概念不是针对公式定义的,而是针对由公式和 [0,1] 子区间组成的对定义的。如果 Xi 是与前提 γi∈Γ 相关的区间,Y 是与结论 ψ 相关的区间,则论证 (Γ,ψ) 被认为是 h 有效的,写作 Γ⊨hψ,当且仅当对于所有概率函数P:

如果 P(γi)εXi 对于 1≤i≤n,则 P(ψ)εY

在海尼等人。 (2011)这写成

γ

X1

1

,…,γ

Xn

n

|ψY

并称为标准概率语义。

Nilsson 在概率逻辑方面的工作(1986、1993)引发了人工智能中概率推理的大量研究(Hansen 和 Jaumard 2000;Haenni 等人 2011 第 2 章)。然而,应该指出的是,虽然定理 5 指出函数 L , 和 U , 可以有效地从 Γ∪{ phi} 中的句子确定,但这个问题的计算复杂度相当高(Georgakopoulos et al. 1988, Kavvadias 和 Papadimitriou 1990),因此在现实应用中快速找到这些函数在计算上变得不可行。基于概率论证系统和概率网络的当代方法能够更好地应对这些计算挑战。此外,概率论证系统与 Dempster-Shafer 理论密切相关(Dempster 1968;Shafer 1976;Haenni 和 Lehmann 2003)。然而,对这些方法的扩展讨论超出了本条目(当前版本)的范围;请参阅(Haenni 等人,2011 年)了解最近的一项调查。

3. 基本概率算子

在本节中,我们将研究用相当基本的概率运算符扩展命题语言 L 的概率逻辑。它们与第 2 节中的逻辑不同,因为这里的逻辑涉及对象语言中的概率运算符。 3.1 节讨论定性概率算子; 3.2 节讨论定量概率算子。

3.1 不确定性的定性表示

在许多应用中,概率的定性理论可能有用,甚至是必要的。在某些情况下,没有可用频率来估计概率,或者实际上不可能获得这些频率。此外,人们常常愿意比较两个陈述的概率(“ψ 比 ψ 更有可能”),而无法单独为每个陈述分配明确的概率(Szolovits 和 Pauker 1978,Halpern 和 Rabin 1987)。在这种情况下,定性概率逻辑将很有用。

Hamblin (1959) 是最早的定性概率逻辑之一。该语言使用一元运算符 ◻ 进行扩展,可解读为“可能”。因此,诸如 ◻phi 之类的公式应被解读为“可能 phi”。这种“可能”的概念可以形式化为足够高的(数值)概率(即 P(phi)≥t,对于某个阈值 1/2<t≤1),或者以合理性的形式表示,这是一种非概率的度量概括。 Burgess (1969) 进一步发展了这些系统,重点关注“高数值概率”解释。汉布林和伯吉斯都在他们的系统中引入了额外的算子(例如,表达形而上学的必然性和/或知识),并研究“可能”算子与这些其他模态算子之间的相互作用。然而,“可能”运算符本身已经显示了一些有趣的功能(独立于任何其他运算符)。如果它被解释为“足够高的概率”,那么它不满足原则(◻ψ∧◻ψ)→◻(ψ∧ψ)。这意味着它不是普通的模态运算符,并且不能被赋予 Kripke(关系)语义。 Herzig 和 Longin (2003) 以及 Arló Costa (2005) 为这种“可能”算子提供了较弱的邻域语义系统,而 Yalcin (2010) 从更面向语言的角度讨论了它们的行为。

Segerberg (1971) 和 Gärdenfors (1975a, 1975b) 采取了另一条路线,他们以 de Finetti (1937)、Kraft、Pratt 和 Seidenberg (1959) 以及 Scott (1964) 的早期工作为基础。他们引入了二元运算符 ≥;公式 ψ≥ψ 应理解为“ψ 至少与 ψ 一样可能”(形式为:P(ψ)≥P(ψ))。关键思想是,人们可以完全公理化 ≥ 的行为,而无需使用各个公式的“基础”概率。应该注意的是,通过比较概率(二元运算符),也可以表达一些绝对概率属性(一元运算符)。例如, ψ≥⊤ 表示 ψ 的概率为 1,而 ψ≥ψ 表示 ψ 的概率至少为 1/2。最近,Delgrande和Renne(2015)和Delgrande,Renne和Sack(2019)通过允许≥的参数为公式的有限序列(可能不同长度),从而进一步扩展了定性方法。公式(ϕ1,…,ϕn)≥(ψ1,…,ψm)非正式地读取为“ ϕi的概率的总和至少与ψJ的概率的总和一样高”。可以将所得逻辑完全构成公理,并且可以捕获任何有理数量,从而使其与某些定量概率逻辑一样表现力。但是,它仍然与定量概率逻辑不同,因为语言中没有数字。在以下各节中,我们将注意力转移到定量概率逻辑上。

3.2概率术语的总和和产品

命题概率逻辑是命题逻辑的扩展,这些命题逻辑表达概率项之间的数值关系P(φ)。一个简单的命题概率逻辑增加了形式p(φ)≥q的命题逻辑公式,其中φ是命题公式,q是一个数字。这样的公式断言φ的概率至少为q。语义是使用组成概率函数p的模型正式化的,该模型在集合ω上进行了p,其元素分别赋予命题逻辑的原子命题的真实分配。因此,如果该元素的真实分配使命题公式为真,则在ω元素上是正确的。当且仅当φ为true的ω元素集的概率p时,模型中的公式p(φ)≥q是正确的。参见Ognjanović等人的第3章。 (2016)概述了这种命题概率逻辑。

一些命题概率逻辑包括对象语言中的其他类型的公式,例如涉及概率项的总和和产品的公式。涉及总和的吸引力可以通过概率函数的加性条件来阐明(请参见第2.1节),每当€(ϕ∧ψ)为p时重言式,或等效地为p(ϕ∧ψ)+p(ϕ∧∧)= p(ϕ)。明确涉及概率总和的概率逻辑通常包括概率项的线性组合,例如Fagin等人。 (1990)。在这里,命题逻辑以A1P(ϕ1)+⋯+ANP(ϕn)≥b的形式的公式扩展,其中N是一个正整数,在公式到公式之间可能有所不同,A1,AN和B都是理性数字。以下是一些可以表达的示例。

p(ϕ)≤q通过-p(ϕ)≥ -q,

p(ϕ)<q by -(p(ϕ)≥q),

p(ϕ)= q通过p(ϕ)≥q∧p(ϕ)≤q。

p(ϕ)≥p(ψ)p(ϕ)-p(ψ)≥0。

具有或没有线性组合的表达能力:尽管线性组合提供了一种方便的方式来表达概率项之间的众多关系,但没有概率项的语言仍然非常强大。考虑某些命题公式ϕ和Rational Q的语言限制为p(ϕ)≥q的公式。我们可以定义

p(ϕ)≤q通过p(¬ϕ)≥1-q,

考虑到命题补充的概率等于1减去命题的概率,这是合理的。公式p(ϕ)<q and p(ϕ)= q可以像上面一样无线性组合定义。使用这种限制的概率语言,我们可以以较不直接的方式进行添加性。公式

[p(ϕ∧ψ)=a∧p(ϕ∧×ψ)= b]→p(ϕ)= a+b

指出,如果ϕ∧ψ的概率为a,并且ϕ∧ψ的概率为b,则公式分离的概率(相当于ϕ)为a+b。但是,尽管使用线性组合使我们可以通过使用公式P(φ∧ψ)+p(φ∧月)= p(φ),,通过使用公式P(φ∧ψ)+P(φ),如果我们选择正确的数字A和b,则仅在上面没有线性组合的公式就这样做。 Demey and Sack(2015)对命题概率逻辑与线性组合的表达性进行正式比较。虽然当且仅当它们同意所有不带有线性组合的公式时,任何两个模型都同意所有不带有线性的公式(Demey and Sack的引理4.1(2015)),但并非任何一个由单个公式与线性定义的模型类别可以通过一个没有单个公式(Demey and Sack(2015)的引理4.2)来定义组合。特别是,如果没有线性组合的能力,则由公式P(p)-p(q)≥0定义的模型类别不能定义。

属于给定子集的概率:Ognjanović和Rašković(1999)通过新类型的操作员来扩展概率逻辑的语言:QF。在直觉上,公式qfϕ表示ϕ的概率属于f,对于某些给定的集合f⊆[0,1]。该QF操作员无法根据p(ϕ)≥a的公式来定义。 Ognjanović和Rašković(1999)提供了这种逻辑系统的声音和完整的公理化。对于所有A∈F而言,将QF操作员连接到更标准的P型操作员的关键桥原理是公理P(ϕ)= A→QFD A→QFDA→QFDA,以及指定P(从P(ϕ))的无限规则=对于所有a∈F,可以推断qfϕ→ψ。

多项式重量公式:具有多项式权重公式的逻辑(涉及加权总和和概率项的产物),可以允许形式p(ϕ)p(ψ)p(ψ)-p(ϕ∧∧ψ)= 0的公式,即ϕ和ψ的概率都等于ϕ和ψ概率的乘积。该公式捕获了ϕ和ψ在统计上独立的含义。在Fagin等人中研究了这种逻辑。 (1990年),但主要具有一阶逻辑特征,然后在Perović等人的更简单的上下文(无量词)中再次使用。 (2008)。

紧凑性和完整性:紧凑性是逻辑的属性,如果每个有限子集都可以满足一组公式。命题概率逻辑缺乏紧凑型属性,因为{p(p)>0}∪{p(p)≤a| a>0}的每个有限子集都是可满足的,但整个集合不令人满足。

如果没有紧凑性,逻辑可能会弱完成(每个有效公式在公理系统中都可以证明),但并非完全完整(对于公式的每个集合γ,γ的每种逻辑后果都可以从公理系统中从γ中证明)。在Fagin等人中。 (1990年),给出了涉及线性组合的证明系统,逻辑被证明既声音又弱完成。在Ognjanović和Rašković(1999)中,为命题概率逻辑提供了一个声音和强烈的证明系统,而无需线性组合。在Heifetz and Mongin(2001)中,一种用于逻辑变化的证明系统,没有线性组合,它使用类型的系统允许迭代概率公式的迭代(我们将在第4节中看到如何使用可能的世界来实现这种迭代))给出了,逻辑被证明是声音且弱完成的。他们还观察到,没有针对这种逻辑的限制性证明系统可以是强烈的。 Ognjanović等。 (2008年)提出了一些具有无限派生规则(需要数量无限数量的前提)的定性概率逻辑,并证明了强烈的完整性。 Goldblatt(2010)介绍了相关膜逻辑的强烈完整的证明系统。 Perović等。 (2008年)提供了使用多项式重量公式的命题概率逻辑的证明系统和强大的完整性证明。最后,获得强大完整性的另一种策略涉及将概率函数的范围限制为固定的有限数字集。例如,Ognjanović等人。 (2008年)讨论了概率逻辑,其中概率函数的范围不是完整的实际单位间隔[0,1],而是“离散”版本{0,

1

n

,

2

n

,…,,

n -1

n

,1}(对于某些固定的数字n∈N)。参见Ognjanović等人的第7章。 (2016)概述完整结果。

4。模态概率逻辑

许多概率逻辑是通过单个但任意的概率空间来解释的。模态概率逻辑利用了许多概率空间,每个空间都与可能的世界或状态相关联。这可以被视为对模态逻辑的关系语义的少量调整:而不是像在模态逻辑,模态概率逻辑中所做的那样,与每个可能的世界一组可访问的世界联系在一起,或一组概率分布。模态概率逻辑的语言允许将概率嵌入概率中,也就是说,例如(可能是不同)概率为1/2的概率的原因。通常给出了(1)随机解释的这种模态设置,关于下一个系统可能会过渡到下一个状态的不同概率(Larsen和Skou 1991),以及(2)主观解释,涉及不同概率,这些概率不同,这些概率是不同的概率可能有局势或彼此的概率(Fagin and Halpern 1988)。两种解释都可以使用完全相同的正式框架。

基本的模态概率逻辑增加了p(ϕ)≥q的命题逻辑公式,其中q通常是一个有理数,而ϕ是语言的任何公式,可能是概率公式。这种公式的读数是至少是q的概率。对公式的一般阅读并不能反映具有相同公式的模态概率逻辑和其他概率逻辑之间的任何区别。区别在于能够以概率术语和语义的参数嵌入概率的能力。以下小节概述了模态概率逻辑的建模方式的变化。在一种情况下,语言会稍微更改(第4.2节),在其他情况下,逻辑会扩展以解决定性和定量不确定性之间的相互作用(第4.4节和第4.5节)或动态(第4.6节)。

(本章完)

相关推荐