动态认知逻辑(六)
合理性动作模型。给定一组公式\ lang和有限的非空置代理集\ sa,一个合理的操作模型是一个结构a =(e,\ geq,\ pre),由
可能发生的可能发生的交流事件的非空置集合
分配给每个代理A \ in \ sa的函数\ geq,在E上满足了前面定义的合理性的属性,并且
一个函数\ pre:e \ to \ lang,在e公式\ pre(e)\ in \ lang中分配给每个事件e,称为e的前提。直观地,在事件发生时宣布了前提条件。
一个尖锐的合理性动作模型,有时也称为动作,是由合理性动作模型A和一个称为点的事件E组成的对(a,e)。在绘制合理性动作模型时,将事件绘制为矩形,一个点(如果有)用双矩形指示,并使用破折号(对于合理性模型)绘制箭头。我们使用许多相同的图形和术语惯例,用于用于(尖)合理模型的合理性动作模型。
正如预期的那样,合理性动作模型和基本动作模型之间的主要区别在于,特定于代理的组件(即,给出特定于代理的关系\ geq_a的函数\ geq)。在基于合理性动作模型的新的合理性模型时,我们可能会遵循类似于产品更新的结构。为了完成这项工作,我们的主要任务是描述如何根据给定的初始合理性模型M和合理性动作模型来确定结果合理性模型m [a]中的合理性关系\ geq_a。为此,考虑一个例子将很有帮助。
\ rpub_g(q)
图9:可修订的Q公开宣布(也称为van Benthem 2007的“词素升级”),尖锐的合理性动作模型(\ rpub(q),e)。
图9描述(\ rpub(q),e),一个由两个事件组成的尖锐的合理性动作模型:宣布\ lnot q的事件f,并宣布Q的事件E。事件E是实际发生的事件。对于每个代理A(来自全套代理\ sa),事件E严格来说更合理。我们为合理性模型所做的合理性动作模型采用相同的图纸惯例:单向箭头和双向箭头,反身和及时的封闭以及对局部连接性的要求。 (由于事件的集合是有限的。)相应地,图9隐式包含每个事件中每个代理的反身虚线箭头。
(\ rpub(q),e)具有以下直觉效果:Q(即事件e)的公开宣布发生,这是常识;但是,代理商仍然保持否定Q宣布否定的可能性(即发生事件F)。实际上,代理商会相信Q(因为宣布这是最合理的),但是他们仍然会保持Q是错误的可能性。这使代理商可以接受已宣布的公式Q,但要谨慎地接受:如果以后得知Q是错误的,他们仍然可以修改他们的信念。
“行动优先更新”是合理性模型产品更新的类似物。
动作优先更新(Baltag和SMETS 2008b)。令(m,w)为尖锐的合理性模型,(a,e)为尖锐的合理性动作模型。让\模型是在PRAAUSIBY ACTION模型A的前提函数的语言\ lang中定义(M,W)和公式之间定义的二进制满意度关系。模型\ pre^a(e),然后通过动作优先更新操作m \ mapsto来定义模型m [a] =(a] =(w [a],{\ geq} [a],v [a]) m [a]如下:
w [a] \ coloneqq \ {(v,f)\ in w \ times e \ mid m,v \ models \ pre^a(f)\} - 将世界与他们满足的前提条件的事件配对;
(v_1,f_1)\ mathrel {{\ geq} [a] _a}(v_2,f_2),并且仅当我们有以下一个:
f_1 \ gt_a f_2和\ cc_a(v_1)= \ cc_a(v_2) - 严格不同的合理性事件适用于信息等效的世界,或
f_1 \ simeq_a f_2和v_1 \ geq_a v_2 - equi-plausible事件被应用于不同合理性的信息等效世界;
v [a]((v,f))\ coloneqq v^m(p) - 在对(v,f)上进行P的估值,就像在v处一样。
操作(a,e)在最初情况(m,w)通过动作优先更新满足m,w \ models \ pre^a(e)以产生结果情况(m [a],(w,w,) e))。请注意,我们可以为代理A编写合理性关系\ Mathrel {{\ geq} [a] _a}在Action-Porierity更新之后,AS a as as as as as as as as as as as as as as as \ GEQ_A时,当含义从上下文中清楚时。
现在,我们转向动作优先更新逻辑(又称Doxastic Action的逻辑)。首先,我们根据以下recursive Grammar:根据语言\ eqref {apul}的尖锐的plausibility Action模型来定义Action-Porierity更新逻辑的语言\ eqref {apul}以及尖的Plausibility Action模型的集合\ pam_*。
\ begin {chater*} f \ ccoloneqq p \ mid f \ wedge f \ mid \ neg f \ neg f \ mid k_af \ mid \ box_af \ box_af \ mid [a,e] f \ \ \ f \ \ \ small p \ in \ sp,\; \ in \ sa,\; (a,e)\ in \ pam_* \ taglabel {apul} \ end {gather*}
\ eqref {apul}的尖头合理性模型和公式之间的满意度关系\模型是\ eqref {kbox}的上述满意度关系\模型的最小扩展。
m,w \ model [a,e] g在且仅当m,w \ w \ dot \ pre(e)或m [a],(w,e)\模型g时,其中模型m [a]由动作优先更新给出。
除了可修订的公开公告(图9)外,还有许多有趣的尖锐的合理性动作模型。
\ rpri_g(q)
图11:指向Q的私人公告向代理G组的私人公告。
图11描述了向一组代理G的私人宣布。这是两个事件:宣布Q的事件E和宣布真实\ TOP的命题常数的事件F。对于G组以外的代理商,最合理的事件是宣布\ top的事件。对于小组中的代理商,最合理的事件是宣布Q的事件。实际上,Q(即事件e)的宣布发生。由于对真理的命题常数是无信息的,因此G之外的代理人会相信这种情况与以前一样。但是,G内部的代理人会相信Q。
私人公告的合理性动作模型版本(图11)几乎与私人公告的动作模型版本相同(图3)。这是因为动作模型很容易转换为合理性动作模型:只需将箭头更改为虚线箭头即可。通过这种方式,我们很容易从现有的动作模型中获得合理的行动模型。特别是,我们可以通过转换图4来通过转换图5来获得公开公告的合理性行动,并通过转换图5来获得半私人公告,并通过转换图6来获得误导性的私人公告。
最后,Van Benthem(2007)研究了使用动作优先更新代表的多项式合理性模型的两个重要操作。
词典升级[\ up f] g(Rott 1989; van Benthem 2007):在更改了合理性关系之后,以使F-worlds在\ lnot f-worlds上排名,但是F-和\ lnot F-Regions中的每个世界都在像以前一样排名,G是真实的。 F的词典升级只是F(图9)的可重新公开宣布:M,W \ Models [\ up f] g \ Quad \ text {iff} m,w \ w \ models [\ rpub(f),e] g。
保守的升级[\ up f] g(Boutilier 1993; van benthem 2007):在改变了合理性关系之后,以使最佳的F-Worlds在其他所有世界中排名,但排名不变,G是正确的。我们注意到,如果代理的集合\ sa仅由一个代理A组成,则我们有\ begin {align*} m,w \ models [\ up f] g \ quad&\ quad&\ text {iff} m, w \ models [\ up*_af] g \\&\ text {iff} m,w \ models [\ rpub(*_ af),e] \ end {align {align*},该{align*}表示,f fif f f f f f f。这在单个代理a的情况下, *_af的词典升级。这是有道理的: *_af挑选出最合理的F-worlds,然后词典升级\ UP *_ AF将这些最合理的F-Worlds排名为最合理的总体总体,并像以前一样将所有其他排名留下。在具有N代理的多代理情况下,我们观察到具有2^n动作的合理性动作模型相当于\ up f。特别是,让\ cu(f)\ coloneqq(e,\ geq,\ pre)为合理性动作模型定义如下:
e \ coloneqq \ {e_i \ mid i \ subseteq \ sa \} - 每个(可能为空的)子集I \ subseteq \ sa of Agents的每个事件E_I,
e_i \ geq_a e_j i时,仅当j - 事件e_j中的a \ e_j在iff a是j是j的成员的情况下,e_j是相等的,或
\ pre(e_i)\ coloneqq(\ bigWedge_ {i \ in I} *_ i f)\ land(\ bigwedge_ {j \ in(\ sa-i)} \ lnot *_jf)对于I中的代理商的最佳F世界,而不是I.中的代理商的最佳F-Worlds。
从直觉上讲,这种合理的行动模型使每个代理都将事件分为两个类别:根据构成的第一类,是最好的F-Worlds的类别,并且排名最高,而那些不是最好的F-worlds,与第二类相比,排名第二,排名严格不太合理。特别是,由于我们有e_i \ leq_a e_j,并且仅当a在i中时,因此遵循:
如果我\在i \ cap j中,则e_i \ simeq_a e_j;
如果我在i-j中,则e_i \ lt_a e_j;
如果我在j-i中,则e_i \ gt_a e_j;
如果我\ in \ sa-(i \ cup j),则e_i \ simeq_a e_j。
因此,e_i在我中我构成了第一类,并且总体上排名最合理,而e_i没有我在第二类中没有我的排名。排列前提条件,以使任何两个事件成对不一致:如果我\ neq j,那么我和j在至少一个代理A上有所不同,因此它们在其前提条件上断言 *_af还是其否定\ lnot *_af方面有所不同。此外,事件的前提条件耗尽了所有可能性:给定一个合理性模型的世界,有一套(可能是空的)代理I,使得我中的代理人将其排名为最佳的F-World,而这些代理不在我不认为W是最好的F-World;因此,World W可以满足有关I的E_I的前提。因此,\ cu(f)中的事件将给定输入合格模型的世界划分为多个部分,每个子集i \ subseteq \ sa一个部分。与子集I相对应的给定模型的部分是通过事件E_I挑选的,由给定模型中的这些世界组成,这些模型满足了前提条件\ pre(e_i);这些世界是根据i中的代理商而不是最好的F-Worlds的最佳F世界的世界代理商认为给定文章中的世界是最好的F-Worlds,代理商对作品进行了排名,以便每个代理商拥有她最好的F-Worlds超过所有其他世界,否则将其排名原样。因此,很难看到我们有M,W \ model [\ up f] g \ quad \ text {iff} m,w \ models \ bigVee_ {i \ subseteq \ sa} [\ cu(f) ,e_i] g \ mbox {(一般情况),}说,F的保守性升级等于尖锐的合理性动作模型(\ cu(f),e_i)带来的动作优先更新对于某个子集I \ subseteq \ sa。如前所述,初始模型中的世界将满足一个事件E_J的前提。因此,通过析取\ bigVee_ {i \ subseteq \ sa} [\ cu(f),e_i] g的真相是通过评估析取[\ cu(f),e_j] g的真相来确定的。对应于w的特定j。
现在,我们研究了行动优先更新逻辑的公理理论。
公理理论\ apul。
理论\ kbox的公理计划和规则
减少公理:
[a,e] p \ leftrightArrow(\ pre(e)\ t p)for Letters P \ in \ sp in \ sp
“在采取了不可执行的行动之后,每个字母都会构成矛盾。经过可执行的动作,字母保留了他们的真实价值观。”
[a,e](g \ land h)\ leftrightArrow([a,e] g \ land [a,e] h)
“如果每个结合都采取动作,则连词是正确的。”
[a,e] \ lnot g \ leftrightArrow(\ pre(e)\ to \ lnot [a,e] g)
“ g是在操作后是错误的,如果动作可执行,则不会使g成真。”
[a,e] k_ag \ leftrightArrow(\ pre(e)\ to \ bigwedge_ {e \ simeq_a f} k_a [a,f] g)
“ A有一个信息,即每当可执行时采取行动后的G之后,尽管她的实际事件信息存在不确定性,但仍会提供一个信息。”
[a,e] \ box_a g \ leftrightArrow(\ pre(e)\ to(\ bigWedge_ {e \ gt_a f} k_a [a,f] g)\ land(\ bigWedge_ {e \ simeq_a f} ,f] g))
“在操作后,一个不诚实的g知道g,iff措施(无论何时可执行)提供了一个信息,即在所有更合理的事件之后,g将成为真实的信息,并且进一步提供了一个不可避免的知识,即在所有等式事件之后,g将成为真实的事件。”
行动必需规则:从G,推断[A,E] G
“任何行动后都有有效性。”
前三个还原公理与\ eal的相应还原公理相同。第四\ APUL还原公理几乎与第四\ EAL还原公理相同。特别是,第四\ eal还原公理,读取
\ textStyle [a,e] k_ag \ leftrightArrow(\ pre(e)\ to \ bigWedge_ {e r_af} k_a [a,f] g),
仅在右侧的连接中有所不同:\ eal公理通过Kripke Model-Style-Style Relyation r_a在与E相关的事件上具有连接性,而\ apul axiom在与E通过Plaausibility Model相关的事件中均具有相互结合 - 风格的关系\ simeq_a。
第五\ APUL还原公理是新的。该公理捕获了行动优先更新的本质:要使代理在行动后具有不稳定的知识,她必须了解由于采取更合理的行动而发生的情况,此外,她必须对有关结果的知识有敏捷的知识等式的行动。其原因是从结果的合理性关系{\ geq} [a] _a的定义。提醒一下,这是通过设置(v_1,f_1)\ mathrel {{\ geq} [a] _a}(v_2,f_2)来定义的。
F_1 \ gt_a f_2和\ cc_a(v_1)= \ cc_a(v_2) - 严格不同的合理性事件应用于信息等效的世界;或者
F_1 \ Simeq_a F_2和V_1 \ GEQ_A V_2 - Equi-Plausible事件被应用于不同合理性的信息等效世界。
寻找第五\ apul减少公理,conjunct \ bigwedge_ {e \ gt_a f} k_a [a,f] g说,每当出现的事件严格地比E应用于A内的世界中,G是正确的。 。这告诉我们,鉴于上面的第一个项目符号项目,G在世界上具有更大合理性的世界。第五\ apul降低的另一个相关\ bigWedge_ { A的当前连接组件。这告诉我们,鉴于上面的第二个项目符号项目,G在具有更大或相等的合理性的世界上是真实的。综上所述,由于这两个项目定义了何时在最初的模型m [a]中世界具有相等或更大的合理性,因此这两个结合在最初情况(m,w)的真实性(a,e) )是可执行的,这意味着与所得模型m [a]的现实世界(w,e)相比,g在所有具有相等或更合理的世界上都是真实的。也就是说,我们有m [a],(w,e)\ models \ box_a g,因此m,w \ models [a,e] g。这解释了第五\ APUL还原公理的左侧方向。从左到右的方向也是如此。
与\ eal一样,\ apul降低公理使我们能够“减少”每个公式,其中包含合理性动作模型到可证明的等效公式,其合理性动作模型模型在较小的复杂性的公式之前出现,从而使我们消除了Plaause Plaause Modalities模型模型模型完全通过一系列可证明的等价。结果,我们有以下内容。
APUL还原定理。语言中的每个f \ eqref {apul}都是\ apul pul cover covel的等同于公式f^\ circ来自Polausibility Action Diction Model Model-File-Modal语言\ EQREF {Kbox}。
一旦我们证明\ apul是正确的,还原定理将通过已知的基础模态理论\ kbox的已知完整性导致我们达到公理性完整性。
\ apul的声音和完整性。 \ apul与尖的合理性动作模型的集合相对于收集\ sc_*是合理的。也就是说,对于每个\ eqref {apul} -formula f,我们有\ apul \ vdash f,仅当且仅当\ sc _*\型号F。
与\ eal一样,可以将两个连续的动作结合到一个动作中。所需的只是一个合适的合理性动作模型组成概念。