A的选择是由极大值准则决定的,她会考虑她可能采取的每种策略,在每种情况下,考虑她遵循这些策略所能获得的最低收益。然后她选择最小收益最大的策略。
正如作者所指出的,A的策略是极其保守和悲观的。这是因为,该策略很大程度上依赖于代理人B的能力。玩家A通过这种方法确保了自己的最低收益。
MiniMax法
另一个参与人C,采用了MiniMax法,看看对手D在C的每种策略下能获得多少收益,然后C选择给D最低收益的策略,D总是这么做以使自己的收益最大化的话。
正如戴曼德所说,“MaxiMin法假设玩家希望保证自己的最小收益。Minimax法推测一个玩家想要保证对手的最大收益最小”。Maximin是保守贪心的, 而Minimax 是保守进攻性的。
冯·诺伊曼极小极大值定理(Minimax Theorem)(1928)
Zur Theorie der Gesellschaftsspiele ¹).
Von
J.v. Neumann in Berlin.
────
Einleitung.
1. Die Frage, deren Beantwortung die vorliegende Arbeit anstrebt
ist die folgende:
n Spieler,S₁,S₂,...,Sₙ,spielen ein gegebenes Gesellschαjtsapiel 𝕲.
Wie muβ einer dieser Spieler, S, spielen,um dαbei ein mōglichst günstiges Resultαt zu erzielen?
Die Fragestellung ist allgemein bekannt,und es gibt wohl kaum eine
Frage des täglichen Lebens, in die dieses Problem nicht hineinspielte;trotzdem ist der Sinn dieser Frage kein eindeutig klarer. Denn sobald n>1 ist (d. h. ein eigentliches Spiel vorliegt), hängt das Schicksal eines jeden Spielers auBer von seinen eigenen Handlungen such noch von denen seiner Mitspieler ab;und deren Benehmen ist von genau denselben egoistischen Motiven beherrscht,die wir beim ersten Spieler bestimmen mochten.Man fühlt,daB ein gewisser Zirkel im Wesen der Sache liegt.
Wir missen also versuchen, zu einer klaren Fragestellung zu kommen.
数学联邦政治世界观提示您:看后求收藏(同人小说网http://tongren.me),接着再看更方便。