动态认知逻辑(五)

信息等价。当且仅当 cca(w)=cca(v) 时,世界 v 和 w 被认为是信息等价的(对于代理 a)。请注意,我们有 cca​​(w)=cca(v) 当且仅当 v ∈ cca(w) 当且仅当 w ∈ cca(v) 时。

这个想法是,如果 w 是现实世界,那么代理 a 就知道现实世界一定是她的连通分量 cca(w) 中的世界之一。因此,只要 w 是现实世界,集合 cca(w) 就构成了代理 a 认为可能的世界。并且由于w∈cca(w),智能体a将始终认为现实世界是可能的。然后,本地连接保证代理始终对她认为可能的 cca(w) 中任何两个世界的相对合理性有自己的看法。

局部连通性的一个结果是,信息等价状态可以根据格罗夫的同心球思想(Grove 1988)进行分层:总体上最合理的世界位于最内层的球体上,次最合理的世界位于下一个球体上。最大的球体,依此类推,一直到在最大的球体上定位最不可信的世界。 (我们的合理性模型图片中的世界数量始终是有限的,否则我们无法根据上述指定的约定来绘制它们,因此总是可以通过这种方式将我们图片中的世界组织成同心球体。)

Grove spheres (Grove 1988) 还提出了一种在合理性模型中进行静态信念修正的自然方法:如果代理被完全可信的来源告知,现实世界位于她的信息等效世界的某个非空子集 S⊆cca(w) 中,那么她会将注意力限制在 S 中的世界上。S 中最合理的世界将是她认为总体上最合理的世界,即S 中下一个最合理的世界将是她随后认为总体上下一个最合理的世界,依此类推。也就是说,她将围绕 S 集合“重新定位”她的球体系统。

为了了解这一切是如何工作的,让我们考虑一个简单的示例场景,其中我们的两个代理 a 和 b 正在讨论两个陈述 p 和 q 的真实性。在对话过程中,众所周知,两个代理都没有关于 q 的任何信息,因此也不知道 q 是否为真,尽管事实证明 q 恰好为真。然而,众所周知,代理人 b 是某个研究领域的专家,其工作内容包括 p 是否为真问题。此外,代理人b公开发表了他的专家意见:p是真的。代理人 a 信任代理人 b 的专业知识,因此她(代理人 a)开始相信 p 是真的。但她的信任并不是绝对的:a仍然认为代理人b有错或欺骗的可能性;因此她愿意承认她对 p 的信念是不正确的。尽管如此,她现在确实信任 b 并且开始相信 p。不幸的是,她的信任是错误的:特工 B 故意撒谎; p 实际上是假的。我们在图 8 中描绘了这种场景。

图 8:明确的合理性模型 (N,w1)。

很容易看出,指向的合理性模型(N,w1)明显满足局部连通性,因此这是一个允许的图景。要看到这张图片合理地代表了上述示例场景,首先请注意,对于两个字母 p 和 q 的四种可能的真值分配,我们都有一个世界。在现实世界 w1 中,字母 p 为假,字母 q 为真。特工 a 认为这四个世界中的每一个在信息上都是等价的(因为她不确定哪个世界是真实的世界);然而,她认为 p 世界比 Øp 世界更合理。这代表了她相信 p 为真:她认为总体上最合理的每个世界都满足 p。此外,如果她被告知 p 实际上是错误的,她会将注意力限制在下一个最可信的 Øp 世界上,从而静态地修正她的信念。正是在这个意义上,她信任b(因此相信p是真的),但并不完全排除他是不正确或欺骗性的可能性。由于 a 没有关于 q 的信息,因此她的每个球体(内部 p 球体和外部 Øp 球体)都包含 q 为真的世界和 q 为假的世界。

现在让我们看看代理人 b 的态度。首先,我们看到 b 有两个连通分量,一个由 p 世界组成,另一个由 Øp 世界组成,这两个分量在信息上并不等价。也就是说,在主体 b 的眼中,没有一个 p 世界在信息上等同于 Øp 世界。这告诉我们 b 最终知道 p 是否为真。此外,a 知道情况确实如此(因为 a 的每一个信息等价世界都是 b 知道 p 是否为真的世界)。由于现实世界是 Øp 世界,代理 b 事实上知道 p 是假的。最后,我们看到 b 知道 a 错误地认为 p 为真:在 b 的每个信息等价世界 w1 和 w2 中,代理 a 相信 p 为真(因为 a 总体上最合理的世界 w3 和 w4 都满足 p) 。

我们现在已经准备好对合理性模型进行正式定义。这个定义总结了我们迄今为止所看到的内容。

合理性模型。给定命题字母的非空集合 P 和主体的有限非空集合 A,合理性模型是一个结构

M=(W,≥,V)

组成

一个由世界组成的非空集合 W,确定可能获得的可能的事态,

一个函数 ≥ 为每个代理分配 a∈A W 上的二元关系 ≥a 满足我们很快定义的合理性属性,并且

命题评估 V 将每个命题字母映射到该字母为真的世界集。

我们定义以下关系,通过在关系符号中放置斜杠来表示关系的否定:

逆向合理性:w≤av 意味着我们有 v≥aw。

严格合理性:w>av 意味着我们有 w≥av 且 v≱aw。

严格的逆逻辑合理性:w<av 意味着我们有 v≥aw 且 w≱av。

等价性:w≃av 意味着我们有 w≥av 和 v≥aw。

对于W中的每个世界w和代理a,我们定义w的连通分量,如果强调a很重要,也称为a连通分量,如下:

cca(w):={v∈W∣w(≥a∪≤a)*v}。

如果 cca(w)=cca(w),那么我们说 w 和 v 是信息等价的(或者说它们是 a-信息等价的)。关系 ≥a 必须满足合理性属性,该属性由以下三项组成:

≥a 是自反且及物的;

≥a 是局部连通的:v∈cca(w) 意味着 w≥av 或 v≥aw;和

≥a 是有根据的:对于世界的每个非空集合 S⊆W,该集合

mina(S):={w∈S∣∀v∈S:v≮aw}

S 的 a-最小元素本身非空。

指向的合理性模型,有时称为场景或情况,是由合理性模型 M 和世界 w(称为点)组成的一对 (M,w),它指定我们(正式建模者)当前的事态假设是真实的。

直观上,w≥av 意味着根据代理人 a 的说法,w 并不比 v 更合理。因此,“较小”的世界更可信,因此 mina(ccw(w)) 是代理 a 认为在信息上与 w 等价的所有世界中最可信的世界集合。

正如我们所看到的,本地连接确保智能体对信息等效世界的相对合理性有自己的看法。相反的良好基础保证了智能体总是能够以某种方式对信息等价的世界进行分层,使得某些世界总体上是最合理的。因此,我们不能出现代理 a 有某种序列的情况

w1>aw2>aw3>a⋯

合理性严格增加的世界,在这种情况下不可能找到“最合理的世界”。通过禁止这种情况,相反的充分根据保证了“最合理的世界”的概念始终是明确定义的。

在指向合理性模型上解释的公式集合通常至少包含来自由以下语法定义的语言(???)的公式:

F::=p∣F∧F∣ØF∣KaF∣◻aF

pεP,aεA

指向的合理性模型和\eqref{KBox}公式之间的满足关系\models定义如下。

M,w\models p 当且仅当 w\in V(p) 成立。

M,w\models F\land G 成立当且仅当 M,w\models F 和 M,w\models G 均成立。

M,w\models\lnot F 当且仅当 M,w\not\models F 成立。

M,w\models K_aF 当且仅当 M,v\models F 对于每个 v\in\cc_a(w) 成立。

M,w\models \Box_aF 当且仅当 M,v\models F 对于每个 v\leq_a w 成立。

对于每个 \eqref{KBox}-公式 F 和合理性模型 M = (W, \geq, V),我们定义集合

\sem{F}_M \coloneqq \{ w\in W\mid M,w\models F\}

F 为真的世界。如果M是固定的,我们可以简单地写成\sem{F},而不需要下标M。

K_aF 被分配读数“代理 a 有信息表明 F 为真”。人们可以将 K_a 视为一种知识,尽管不是实际的、现实生活中的主体通常拥有的那种知识(因为它满足逻辑结果下的闭包等属性,而这些属性在实践中通常不满足)。直观上,拥有 F 的信息就是对 F 的信念,这种信念在收到任何进一步的信息(甚至不真实的信息)后仍然存在。因此,这种知识是无误且不可废止的。

我们将 \Box_aF 指定为“代理 a 确实知道 F”。这是 Lehrer 和 Paxson (1969) 以及 Lehrer (1990, 2000) 研究过的弱知识概念,并由 Stalnaker (1980, 2006) 形式化。直观上,F 的可废止知识是在收到任何进一步的真实信息后仍然坚持的对 F 的信念:代理人相信 F,并且如果被告知任何进一步的真实信息,她将继续相信 F。可废止的知识有时也称为“安全信念” 。

信息拥有的双重形式 K_aF,写作 K_a F,表示信息一致性:

\hat K_a F \mbox{ 表示 } \l 不是 K_a\l 不是 F。

这意味着F与代理人a的信息一致。我们用它来定义条件信念的概念:

B_a^GF \mbox{ 表示 } \hat K_aG \to \hat K_a(G\land\Box_a(G\to F))。

它被指定为“代理人 a 相信 F 以 G 为条件”。有时 B_a^GF 缩写为 B_a(F|G)。虽然从上面的定义可以推导出B_a^GF的含义,但下面提供了更直观的解释。

对于每个指向的合理性模型 (M,w),我们有: \textstyle M,w\models B_a^GF \quad\text{iff}\quad \min_a(\sem{G}_M\cap\cc_a(w ))\subseteq\sem{F}_M ;也就是说,代理人 a 相信 F 以世界 w 的 G 为条件,当且仅当 F 在与 a 的信息一致的最合理的 G 世界中为真。

这个定理告诉我们,要了解代理人对 G 的看法,我们所需要做的就是查看代理人最可信的 G 世界。通过这种方式,条件信念使主体将她的球体系统“重新集中”在 G 为真的所有世界的集合上。因此,条件信念实现了静态信念修正:要查看代理人 a 在用 G 静态修正其信念后相信什么,我们只需看看她以 G 为条件相信的是什么。因此 B_a^GF 表示代理人 a 在用 G 静态修正其信念后相信 F 。

条件信念的概念允许我们将知识占有 K_a 和可废止知识 \Box_a 的概念与知识的废止性分析联系起来,如以下结果所示。

对于每个指向的合理性模型(M,w),我们有以下每一个。

M,w\models K_aF 当且仅当对于每个 \eqref{KBox}-公式 G,我们有 M,w\models B_a^GF。

“信息占有K_a是在收到任何信息的情况下持续存在的信念。”

M,w\models\Box_aF 当且仅当对于每个 \eqref{KBox}-公式 G 满足 M,w\models G,我们有 M,w\models B_a^GF。

“可废止的知识\Box_a是在收到真实信息的情况下持续存在的信念。”

有条件信念产生了无条件信念的概念,通过将平凡条件 \top (即真理的命题常数)作为条件而获得:

B_aF \mbox{ 表示 } B_a^\top F 。

因此,为了了解智能体无条件相信什么,我们只需将她的信念条件化在琐碎的条件 \top 上,这在任何地方都是正确的。那么很容易看出我们有以下内容。

对于每个指向的合理性模型 (M,w),我们有: \textstyle M,w\models B_aF \quad\text{iff}\quad \min_a(\cc_a(w))\subseteq\sem{F}_M ;也就是说,当且仅当 F 在与 a 的信息一致的最合理的世界中为真时,主体 a (无条件地)相信世界 w 的 F。

我们用公理理论来总结本节,该公理理论描述了在所有似然性模型中都有效的公式。由于我们可以表达条件信念(并且由于条件信念描述了静态信念修正),因此我们获得的是可废止知识、信息占有、条件信念、无条件信念和静态信念修正的理论。

公理化理论\KBox。

每个 a\in\sA 的 K_a 的 \mathsf{S5} 公理方案和规则

每个 a\in\sA 的 \Box_a 的 \mathsf{S4} 公理方案和规则

K_aF\to\Box_a F

“如果F遵循A的信息,那么A,那么一个不认真的就知道F。”

k_a(\ box_a f \ to g)\ lor k_a(\ box_a g \ t t f t f to f)

“与收到的信息一致的世界总是可以相当的。” (该公理具有此含义需要一些技术细节;请参见Baltag等人(2014年)。特别是,可以将公理视为基本模态逻辑的.3方案的略微修改;例如,参见,例如,Blackburn等人2002年。

\ kbox的声音和完整性。 \ kbox与尖的合理性模型的集合相对于收集\ sc_*是合理的。也就是说,对于每个\ eqref {kbox} -formula f,我们有\ kbox \ vdash f,仅当且仅当\ sc _*\型号F。

与其将信息拥有k_a和不诚实知识\ box_a作为基本命题态度,不如选择有条件的信念语句b_a^gf。此选择给出了条件性杀伤性逻辑的理论\ cdl。有关详细信息,请参见附录J。

我们可能会定义许多其他命题态度,超出有条件的信念B_A^gf,不诚信的知识\ box_af和信息拥有k_af。我们简要介绍了其中两个与信仰修订文献有重要联系的关联。

Unary修订运算符 *_af具有语义:M,W \ models *_af \ mbox {Means} m,W \ Models f \ mbox {and} m,v \ v \ not \ note f \ mbox f \ mbox {for All} v \ lt_a也就是说,在世界上 *_af是正确的,这意味着f在w上是真实的,而在任何世界V中,f是错误的。因此,在w上说 *_ t true,w将是代理商进行F. F.的信念修订之后最合理的。 F.因此,我们有m,w \ models b_a^fg \ quad \ text {iff} m,w \ models k_a(*_ af \ to g),它说代理A当她知道g是F的结果后,F进行了F的修订后,才相信G。

对于每个自然数字n,我们都有一个学位的信念操作员b_a^nf。要定义这些运算符的语义,我们首先根据以下几个自然数字定义公式B_A^n:\ begin {align *} b_a^0&= *_a \ top,\\ b_a^{n+1} &= *_a(\ lnot b_a^0 \ land \ lnot b_a^1 \ land \ cdots \ cdots \ land \ lnot b_a^n)。 \ end {align*} b_a^0在世界上是正确的,代理A总体排名最合理,B_A^1在世界上是正确的,代理A在B_A^0-Worlds,B_A^2 IS之后,Agent A排名第二多个。在B_A^1-Worlds之后挑选出最多的合理,依此类推。 B_A^n-worlds从而选择了代理A的“信仰-N理论”,这是代理人在放弃所有较小程度的理论之后所拥有的信念的集合。这种设置使我们能够实现Spohn(1988)的“信仰程度”的概念:m,w \ models b_a^nf \ mbox {Means} m,w \ w \ models k_a(b_a^n \ f to f) i \ lt n} \ lnot k_a(b_a^i \ to f),它说代理人a会相信f到n时,只有当她知道它的遵循学位-N理论,她不知道从任何较小程度的理论中遵循它。

4.4 Doxastic 行动的逻辑:行动优先级更新

到目前为止,我们已经看到的理论和运营商都涉及静态信念的变化。我们现在希望转向动态的信念变化。为此,该方法遵循动态认知逻辑的典型模式:我们采用给定的静态理论(在这种情况下为\ kbox),并添加了动作模型式方式来创建动态理论。当我们在基本的多模式认知和Doxastic逻辑的情况下进行此操作时,附加动作模型的关系结构与理论模型的关系结构(Kripke模型)匹配。动作模型与有限的Kripke模型之间的结构匹配并不是偶然的:动作模型模式的语义(如BMS产品更新所述)使用相同的基于Kripke模型的基于Kripke模型的概念(即“世界”)描述代理对动作模型对象的不确定性(即“事件”)。两种不确定性都使用相同的结构表示:二进制可能性关系r_a。

对于目前的有条件信念的理论B_A^fg,不诚实的知识\ box_af和信息拥有k_af,我们采用类似的方法:我们定义了合理性动作模型,这些模型是动作模型型对象,其关系结构与模型的关系结构匹配模型的关系结构这个理论 - 成本模型。由于有限的合理性模型具有形式(w,\ geq,v),因此我们从kripke模型案例中的直觉表明,合理性动作模型应具有形式(e,\ geq,\ pre),并有一个有限的非空置非空置事件,\ geq a函数给出了每个代理A的合理性关系\ geq_a,\ \ pre \ pre pre pre preage preage preage precondition函数如前所述。

(本章完)

相关推荐