动态认知逻辑（六）_数学联邦政治世界观()

合理性动作模型。给定一组公式\ lang和有限的非空置代理集\ sa，一个合理的操作模型是一个结构a =（e，\ geq，\ pre），由

可能发生的可能发生的交流事件的非空置集合

分配给每个代理A \ in \ sa的函数\ geq，在E上满足了前面定义的合理性的属性，并且

一个函数\ pre：e \ to \ lang，在e公式\ pre（e）\ in \ lang中分配给每个事件e，称为e的前提。直观地，在事件发生时宣布了前提条件。

一个尖锐的合理性动作模型，有时也称为动作，是由合理性动作模型A和一个称为点的事件E组成的对（a，e）。在绘制合理性动作模型时，将事件绘制为矩形，一个点（如果有）用双矩形指示，并使用破折号（对于合理性模型）绘制箭头。我们使用许多相同的图形和术语惯例，用于用于（尖）合理模型的合理性动作模型。

正如预期的那样，合理性动作模型和基本动作模型之间的主要区别在于，特定于代理的组件（即，给出特定于代理的关系\ geq_a的函数\ geq）。在基于合理性动作模型的新的合理性模型时，我们可能会遵循类似于产品更新的结构。为了完成这项工作，我们的主要任务是描述如何根据给定的初始合理性模型M和合理性动作模型来确定结果合理性模型m [a]中的合理性关系\ geq_a。为此，考虑一个例子将很有帮助。

\ rpub_g（q）

图9：可修订的Q公开宣布（也称为van Benthem 2007的“词素升级”），尖锐的合理性动作模型（\ rpub（q），e）。

图9描述（\ rpub（q），e），一个由两个事件组成的尖锐的合理性动作模型：宣布\ lnot q的事件f，并宣布Q的事件E。事件E是实际发生的事件。对于每个代理A（来自全套代理\ sa），事件E严格来说更合理。我们为合理性模型所做的合理性动作模型采用相同的图纸惯例：单向箭头和双向箭头，反身和及时的封闭以及对局部连接性的要求。（由于事件的集合是有限的。）相应地，图9隐式包含每个事件中每个代理的反身虚线箭头。

（\ rpub（q），e）具有以下直觉效果：Q（即事件e）的公开宣布发生，这是常识；但是，代理商仍然保持否定Q宣布否定的可能性（即发生事件F）。实际上，代理商会相信Q（因为宣布这是最合理的），但是他们仍然会保持Q是错误的可能性。这使代理商可以接受已宣布的公式Q，但要谨慎地接受：如果以后得知Q是错误的，他们仍然可以修改他们的信念。

“行动优先更新”是合理性模型产品更新的类似物。

动作优先更新（Baltag和SMETS 2008b）。令（m，w）为尖锐的合理性模型，（a，e）为尖锐的合理性动作模型。让\模型是在PRAAUSIBY ACTION模型A的前提函数的语言\ lang中定义（M，W）和公式之间定义的二进制满意度关系。模型\ pre^a（e），然后通过动作优先更新操作m \ mapsto来定义模型m [a] =（a] =（w [a]，{\ geq} [a]，v [a]） m [a]如下：

w [a] \ coloneqq \ {（v，f）\ in w \ times e \ mid m，v \ models \ pre^a（f）\} - 将世界与他们满足的前提条件的事件配对；

（v_1，f_1）\ mathrel {{\ geq} [a] _a}（v_2，f_2），并且仅当我们有以下一个：

f_1 \ gt_a f_2和\ cc_a（v_1）= \ cc_a（v_2） - 严格不同的合理性事件适用于信息等效的世界，或

f_1 \ simeq_a f_2和v_1 \ geq_a v_2 - equi-plausible事件被应用于不同合理性的信息等效世界；

v [a]（（v，f））\ coloneqq v^m（p） - 在对（v，f）上进行P的估值，就像在v处一样。

操作（a，e）在最初情况（m，w）通过动作优先更新满足m，w \ models \ pre^a（e）以产生结果情况（m [a]，（w，w，） e））。请注意，我们可以为代理A编写合理性关系\ Mathrel {{\ geq} [a] _a}在Action-Porierity更新之后，AS a as as as as as as as as as as as as as as as \ GEQ_A时，当含义从上下文中清楚时。

现在，我们转向动作优先更新逻辑（又称Doxastic Action的逻辑）。首先，我们根据以下recursive Grammar：根据语言\ eqref {apul}的尖锐的plausibility Action模型来定义Action-Porierity更新逻辑的语言\ eqref {apul}以及尖的Plausibility Action模型的集合\ pam_*。

\ begin {chater*} f \ ccoloneqq p \ mid f \ wedge f \ mid \ neg f \ neg f \ mid k_af \ mid \ box_af \ box_af \ mid [a，e] f \ \ \ f \ \ \ small p \ in \ sp，\; \ in \ sa，\; （a，e）\ in \ pam_* \ taglabel {apul} \ end {gather*}

\ eqref {apul}的尖头合理性模型和公式之间的满意度关系\模型是\ eqref {kbox}的上述满意度关系\模型的最小扩展。

m，w \ model [a，e] g在且仅当m，w \ w \ dot \ pre（e）或m [a]，（w，e）\模型g时，其中模型m [a]由动作优先更新给出。

除了可修订的公开公告（图9）外，还有许多有趣的尖锐的合理性动作模型。

\ rpri_g（q）

图11：指向Q的私人公告向代理G组的私人公告。

图11描述了向一组代理G的私人宣布。这是两个事件：宣布Q的事件E和宣布真实\ TOP的命题常数的事件F。对于G组以外的代理商，最合理的事件是宣布\ top的事件。对于小组中的代理商，最合理的事件是宣布Q的事件。实际上，Q（即事件e）的宣布发生。由于对真理的命题常数是无信息的，因此G之外的代理人会相信这种情况与以前一样。但是，G内部的代理人会相信Q。

私人公告的合理性动作模型版本（图11）几乎与私人公告的动作模型版本相同（图3）。这是因为动作模型很容易转换为合理性动作模型：只需将箭头更改为虚线箭头即可。通过这种方式，我们很容易从现有的动作模型中获得合理的行动模型。特别是，我们可以通过转换图4来通过转换图5来获得公开公告的合理性行动，并通过转换图5来获得半私人公告，并通过转换图6来获得误导性的私人公告。

最后，Van Benthem（2007）研究了使用动作优先更新代表的多项式合理性模型的两个重要操作。

词典升级[\ up f] g（Rott 1989; van Benthem 2007）：在更改了合理性关系之后，以使F-worlds在\ lnot f-worlds上排名，但是F-和\ lnot F-Regions中的每个世界都在像以前一样排名，G是真实的。 F的词典升级只是F（图9）的可重新公开宣布：M，W \ Models [\ up f] g \ Quad \ text {iff} m，w \ w \ models [\ rpub（f），e] g。

保守的升级[\ up f] g（Boutilier 1993; van benthem 2007）：在改变了合理性关系之后，以使最佳的F-Worlds在其他所有世界中排名，但排名不变，G是正确的。我们注意到，如果代理的集合\ sa仅由一个代理A组成，则我们有\ begin {align*} m，w \ models [\ up f] g \ quad＆\ quad＆\ text {iff} m， w \ models [\ up*_af] g \\＆\ text {iff} m，w \ models [\ rpub（*_ af），e] \ end {align {align*}，该{align*}表示，f fif f f f f f f。这在单个代理a的情况下， *_af的词典升级。这是有道理的： *_af挑选出最合理的F-worlds，然后词典升级\ UP *_ AF将这些最合理的F-Worlds排名为最合理的总体总体，并像以前一样将所有其他排名留下。在具有N代理的多代理情况下，我们观察到具有2^n动作的合理性动作模型相当于\ up f。特别是，让\ cu（f）\ coloneqq（e，\ geq，\ pre）为合理性动作模型定义如下：

e \ coloneqq \ {e_i \ mid i \ subseteq \ sa \} - 每个（可能为空的）子集I \ subseteq \ sa of Agents的每个事件E_I，

e_i \ geq_a e_j i时，仅当j - 事件e_j中的a \ e_j在iff a是j是j的成员的情况下，e_j是相等的，或

\ pre（e_i）\ coloneqq（\ bigWedge_ {i \ in I} *_ i f）\ land（\ bigwedge_ {j \ in（\ sa-i）} \ lnot *_jf）对于I中的代理商的最佳F世界，而不是I.中的代理商的最佳F-Worlds。

从直觉上讲，这种合理的行动模型使每个代理都将事件分为两个类别：根据构成的第一类，是最好的F-Worlds的类别，并且排名最高，而那些不是最好的F-worlds，与第二类相比，排名第二，排名严格不太合理。特别是，由于我们有e_i \ leq_a e_j，并且仅当a在i中时，因此遵循：

如果我\在i \ cap j中，则e_i \ simeq_a e_j;

如果我在i-j中，则e_i \ lt_a e_j;

如果我在j-i中，则e_i \ gt_a e_j;

如果我\ in \ sa-（i \ cup j），则e_i \ simeq_a e_j。

因此，e_i在我中我构成了第一类，并且总体上排名最合理，而e_i没有我在第二类中没有我的排名。排列前提条件，以使任何两个事件成对不一致：如果我\ neq j，那么我和j在至少一个代理A上有所不同，因此它们在其前提条件上断言 *_af还是其否定\ lnot *_af方面有所不同。此外，事件的前提条件耗尽了所有可能性：给定一个合理性模型的世界，有一套（可能是空的）代理I，使得我中的代理人将其排名为最佳的F-World，而这些代理不在我不认为W是最好的F-World；因此，World W可以满足有关I的E_I的前提。因此，\ cu（f）中的事件将给定输入合格模型的世界划分为多个部分，每个子集i \ subseteq \ sa一个部分。与子集I相对应的给定模型的部分是通过事件E_I挑选的，由给定模型中的这些世界组成，这些模型满足了前提条件\ pre（e_i）；这些世界是根据i中的代理商而不是最好的F-Worlds的最佳F世界的世界代理商认为给定文章中的世界是最好的F-Worlds，代理商对作品进行了排名，以便每个代理商拥有她最好的F-Worlds超过所有其他世界，否则将其排名原样。因此，很难看到我们有M，W \ model [\ up f] g \ quad \ text {iff} m，w \ models \ bigVee_ {i \ subseteq \ sa} [\ cu（f），e_i] g \ mbox {（一般情况），}说，F的保守性升级等于尖锐的合理性动作模型（\ cu（f），e_i）带来的动作优先更新对于某个子集I \ subseteq \ sa。如前所述，初始模型中的世界将满足一个事件E_J的前提。因此，通过析取\ bigVee_ {i \ subseteq \ sa} [\ cu（f），e_i] g的真相是通过评估析取[\ cu（f），e_j] g的真相来确定的。对应于w的特定j。

现在，我们研究了行动优先更新逻辑的公理理论。

公理理论\ apul。

理论\ kbox的公理计划和规则

减少公理：

[a，e] p \ leftrightArrow（\ pre（e）\ t p）for Letters P \ in \ sp in \ sp

“在采取了不可执行的行动之后，每个字母都会构成矛盾。经过可执行的动作，字母保留了他们的真实价值观。”

[a，e]（g \ land h）\ leftrightArrow（[a，e] g \ land [a，e] h）

“如果每个结合都采取动作，则连词是正确的。”

[a，e] \ lnot g \ leftrightArrow（\ pre（e）\ to \ lnot [a，e] g）

“ g是在操作后是错误的，如果动作可执行，则不会使g成真。”

[a，e] k_ag \ leftrightArrow（\ pre（e）\ to \ bigwedge_ {e \ simeq_a f} k_a [a，f] g）

“ A有一个信息，即每当可执行时采取行动后的G之后，尽管她的实际事件信息存在不确定性，但仍会提供一个信息。”

[a，e] \ box_a g \ leftrightArrow（\ pre（e）\ to（\ bigWedge_ {e \ gt_a f} k_a [a，f] g）\ land（\ bigWedge_ {e \ simeq_a f} ，f] g））

“在操作后，一个不诚实的g知道g，iff措施（无论何时可执行）提供了一个信息，即在所有更合理的事件之后，g将成为真实的信息，并且进一步提供了一个不可避免的知识，即在所有等式事件之后，g将成为真实的事件。”

行动必需规则：从G，推断[A，E] G

“任何行动后都有有效性。”

前三个还原公理与\ eal的相应还原公理相同。第四\ APUL还原公理几乎与第四\ EAL还原公理相同。特别是，第四\ eal还原公理，读取

\ textStyle [a，e] k_ag \ leftrightArrow（\ pre（e）\ to \ bigWedge_ {e r_af} k_a [a，f] g），

仅在右侧的连接中有所不同：\ eal公理通过Kripke Model-Style-Style Relyation r_a在与E相关的事件上具有连接性，而\ apul axiom在与E通过Plaausibility Model相关的事件中均具有相互结合 - 风格的关系\ simeq_a。

第五\ APUL还原公理是新的。该公理捕获了行动优先更新的本质：要使代理在行动后具有不稳定的知识，她必须了解由于采取更合理的行动而发生的情况，此外，她必须对有关结果的知识有敏捷的知识等式的行动。其原因是从结果的合理性关系{\ geq} [a] _a的定义。提醒一下，这是通过设置（v_1，f_1）\ mathrel {{\ geq} [a] _a}（v_2，f_2）来定义的。

F_1 \ gt_a f_2和\ cc_a（v_1）= \ cc_a（v_2） - 严格不同的合理性事件应用于信息等效的世界；或者

F_1 \ Simeq_a F_2和V_1 \ GEQ_A V_2 - Equi-Plausible事件被应用于不同合理性的信息等效世界。

寻找第五\ apul减少公理，conjunct \ bigwedge_ {e \ gt_a f} k_a [a，f] g说，每当出现的事件严格地比E应用于A内的世界中，G是正确的。。这告诉我们，鉴于上面的第一个项目符号项目，G在世界上具有更大合理性的世界。第五\ apul降低的另一个相关\ bigWedge_ { A的当前连接组件。这告诉我们，鉴于上面的第二个项目符号项目，G在具有更大或相等的合理性的世界上是真实的。综上所述，由于这两个项目定义了何时在最初的模型m [a]中世界具有相等或更大的合理性，因此这两个结合在最初情况（m，w）的真实性（a，e））是可执行的，这意味着与所得模型m [a]的现实世界（w，e）相比，g在所有具有相等或更合理的世界上都是真实的。也就是说，我们有m [a]，（w，e）\ models \ box_a g，因此m，w \ models [a，e] g。这解释了第五\ APUL还原公理的左侧方向。从左到右的方向也是如此。

与\ eal一样，\ apul降低公理使我们能够“减少”每个公式，其中包含合理性动作模型到可证明的等效公式，其合理性动作模型模型在较小的复杂性的公式之前出现，从而使我们消除了Plaause Plaause Modalities模型模型模型完全通过一系列可证明的等价。结果，我们有以下内容。

APUL还原定理。语言中的每个f \ eqref {apul}都是\ apul pul cover covel的等同于公式f^\ circ来自Polausibility Action Diction Model Model-File-Modal语言\ EQREF {Kbox}。

一旦我们证明\ apul是正确的，还原定理将通过已知的基础模态理论\ kbox的已知完整性导致我们达到公理性完整性。

\ apul的声音和完整性。 \ apul与尖的合理性动作模型的集合相对于收集\ sc_*是合理的。也就是说，对于每个\ eqref {apul} -formula f，我们有\ apul \ vdash f，仅当且仅当\ sc _*\型号F。

与\ eal一样，可以将两个连续的动作结合到一个动作中。所需的只是一个合适的合理性动作模型组成概念。

（本章完）