理性选择的规范理论:竞争对手预期的效用
reu(f,g)=
n
σ
我= 1
p(ei)(u(十一)氯乙烯(yi))
换句话说,在每个状态下F和G之间的实用程序差异,并通过每个状态的概率权重。 Colyvan类似地定义了无限的状态空间案例
reu(f,g)=
∞
σ
我= 1
p(ei)(u(十一)氯乙烯(yi))。
新规范是f≽giff reu(f,g)≥0。 这条规则在有限状态空间的情况下同意欧盟最大化,但也同意国家明智的主导地位; 因此,可以要求Altadena游戏首选帕萨迪纳比赛,彼得德堡比赛首选汽油比赛。 (另见Colyvan&Hájek2016.)
easwaran(2008)建议了标准欧盟最大化的更适度扩展。 他指出,虽然帕萨迪纳和奥塔迪纳博弈缺乏“强烈”期望,但他们确实有“弱”期望。 (差异对应于大数字的强度和弱法之间的差异。)。 因此,我们可以坚持认为,如果后者存在,则需要在其薄弱期望下重视赌博的赌博者。 (另见Gwiazda 2014,Easwaran 2014B; yey(2008)表明这两个游戏和圣彼得堡悖论可以分配与欧盟理论一致的有限值。)。
Lauwers和Valleentyne(2016年)将easwaran提案的延伸结合在一起,将Colyvan延伸到可间断值的基本相对期望的提议,延长了无限弱期望。 MEACHAM(2019)扩展了COLYVAN的提案,以涵盖案件的案件,其中比较的案件具有在不同状态下比较的公用事业,以及概率依赖的案件; 他的差异最小化理论重新订购每个赌博在采取相对期望之前,从最大的结果到最大的后果。 这两个延伸之间的关键差异是差异最小化理论涉及随机优势和称为随机等效的相关原则。 (另请参阅Schervish,&Kadane 2009中的讨论;Hájek2014; Colyvan&Hájek2016年。)
在从标准欧盟最大化的偏离偏离方面,埃斯瓦伦(2014A)基于国家明智的优势发展了一个公理决策理论,其从实用性和概率开始,并导出了规范性偏好关系。 在适应欧盟最大化的标准参数的情况下,可以使该理论与欧盟最大化同意; 但它还允许我们比较一些具有无限值的行为,并且一些不符合标准参数的行为(例如,不可掩盖的行为,与比较但非数值的概率起作用。
最后,人们可以截断欧盟最大化的规范。 有些人认为,对于涉及非常小的概率的赌博,我们应该将这些概率降至零,而不管所涉及的公用事事件如何。 当与一种聚合剩余可能性的方式结合时,这种策略将为无限的实用悖论产生有限的价值,并且还允许将归因于上帝存在的概率非常小的概率,以避免为上帝投注。 (这个想法追溯到NicolausBernoulli,DanielBernoulli,DanielBernoulli,D'Alambert,Buffon和Borel [查看Monton 2019年历史调查];这一观点的当代支持者包括Jordan 1994,史密斯2014年,莫尔顿2019年。)
3.不允许的性
3.1不可允许的挑战
预期实用程序最大化的另一个挑战是初始化偏好是完全令人令的思想 - 以根据单个一致的实用程序函数对后果进行排序。 在经济学中,这个想法至少返回到Aumann(1962年); 在哲学中,伦理主义者最近被占用了。 经济学家倾向于将挑战造成挑战,以至于对偏好关系完整的想法的挑战,以及良好关系完整的想法的伦理学家。 我使用≽代表一个问题,无论有哪个关系,认识到某些建议可能比另一个案例更引人注目。
关键要求是存在一些选择,其中一个是假的,它是一个优选的(或更好的比),但它们是优选的(或同样好的)也是假的。 拟议的例子包括世俗和严重的:墨西哥餐厅和中国餐馆; 军队的职业生涯和作为牧师的职业; 而且,在萨尔特(1946年)的一个例子中,是否留在一个人的漂亮母亲或加入自由法国人。 占据这些例子的第二个例子:并非如此,军队的职业是(或优于)作为牧师的职业,也不是反之亦然; 但是它们也不是优选的情况(或同样好的)。 呼叫在这些对不可允许的选项之间保持的关系。
即将性是最直接的完整性挑战,因为在最自然的解释上,即A和B是不可赎回的意味着既不是a≽b也不是b≽a。 但是,如果我们假设不计情性是漠不关心的,或者将A 1B定义为b≻a的否定(因此假设通过定义假设完整性),则不允许的性能是对传递效力的挑战。 要了解这一点,请注意,如果两个选项A和B不相称,那么“甜蜜”A稍微更好A +仍然会留下+和B不堪一想。 例如,如果A是军队的职业,A +是这个职业,但薪水略高,后者仍然是牧师的职业。 这种模式足以表明关系〜不及物,因为A〜3和B〜A +,但是A +≻a(de Sousa 1974)。
有四种可执行性的选项。 悔罪主义者认为,关于三个关系中的哪一个(≻,≺,〜)持有的事项总是有些事实,但有时难以或不可能确定哪一个 - 这是一个如此明显的性能。 它们可以以标准方式模拟决策问题,而是作为值的不确定性问题:一个不知道一个人是否处于a≽b的状态,但是一个人为该状态分配一些概率,并最大化预期的效用考虑这些不确定性。 不确定主义者认为,它是不确定的,因为这些关系模糊不清; 因此,不可允许的是一种模糊性(Griffin 1986,Broome 1997,Sugden 2009,Constantinescu 2012)。 在不可掩盖性的情况下,在不可掩盖的情况下,A和B根本无法比较(de Sousa 1974,Raz 1988,Sinnott-Armstrong 1988)。 最后,那些坚持不懈地是平价的人认为,如果可以比较a和b,则在a和b:a和b之间获得第四个关系,如果可以比较a和b,但这是三个关系中的一个(chang 2002a,2002b,2012年,2015年,2016年)。 (昌2002b的分类学;另见张1997年。)
3.2提案:定义
AUMANN(1962)表明,如果我们有一个部分但不是总偏好排序,那么我们可以通过效用函数(不是唯一的仿现 - 变换)表示,使得a≻b意味着欧盟(a)>欧盟(b),但不是反之亦然。 AUMANN表明将存在至少一个实用程序功能,其表示根据(目标)欧盟最大化的偏好排序。 因此,我们可以表示优先顺序作为“单向”代表决策者的首选项的所有实用程序函数集。 让欧盟(a)是给定实用程序功能U的预期效用:
u = {u|(a≻b⇒euu(一)≻euu(b))
和(a~b⇒euu(一)= euu(b))}。
如果没有不可允许的性,那么在U中将有一个(期望)效用功能,如标准欧盟理论中。 但是,当既不aïb也不是b≻a也不是~b时,会有一些u∈u这样欧盟(a)>欧盟(b),以及一些欧盟(b)>欧盟(a); 反之亦然。
Chang(2002A,B)提出了类似的策略,但她需要价值事实是基本的,并定义了更好的关系 - 加上一个新的“奇偶校验”关系我们将表示“∥” - 从它们,而不是反向。 此外,她在A和B之间的评估差异方面定义了这些关系,即(A-B)是A和B之间的所有许可差异的集合。如果(a-b)=∅,则a和b是无可比的; 但是,如果(a-b)≠∅,相关关系是:
a≻bIFF(A-B)仅包含正数
b≻aIFF(A-B)仅包含负数
a ~b iff(a-b)仅包含0
否则答案
(a-b)可能由一组实用程序函数生成,每个函数表示可能的实质性完成实用程序所代表的底层值(在Chang 2002b中讨论); 或者,可能存在“一路下来”(在2016年讨论的情况下),在那里她还替换了在偏差方面的明确数值差异方面取代了定义。
Rabinowicz(2008)提供了一种典型的模型,允许对不可相同的阶段和级别的级别。 在提案上,卓越性关系由“允许偏好排序”的类k表示,每个类可能是完整的或不完整的。 他定义了:
x≻y。iff(∀r∈k)(x≻ry)
x ~y。IFF(∀r∈k)(x〜~r)
x∥y。IFF(∃r∈k)(xīry)&(∃r∈k)(x≻rx)
(他定义了≽作为k的几个“原子”可能性的联盟。)让xty hold iffx≻y或y≻x或x ~y定义:
X和Y是完全可比的IFF(∀r∈k)(Xtry)
x和y完全是一个par,它们完全可比较和x∥y
x和y是无与伦比的iff(∀r∈k)(不是 - (xtry))
x和y是弱无与伦比的iff(∃r∈k)(不是 - (xtry)
k类不一定会产生效用功能。
3.3提案:决策规则
如果决策者的偏好由一组实用程序函数u表示,那么许多可能的决策规则表明自己。 所有提议的规则都侧重于一组替代方案的允许选择的选择,而不是聚合函数或选择的完整排名(我们总是可以从后者恢复前者,而不是反之亦然)。 要了解这些规则中的前三个,我们可以想象地将每个可能的效用职能视为“委员会成员”,并根据关于委员会意见的事实为选择的规则。
首先,我们可以选择一些委员会成员认可的任何选项; 也就是说,我们可能会选择可选择相对于某些实用程序功能的预期实用程序的任何选项:
允许的选择set = {a |(∃u∈u)(∀b∈s)(euu(a)≥euu(b))}
Levi(1974)条款此规则可否受理,野兔(2010年)称其展示展望。 (参见Levi的完整提案的4.3.3节,以及本规则的扩展到决策者没有单一概率函数的情况。)
AUMANN建议我们可以选择任何最大选项:根据所有委员会成员的任何选项都没有比其他一些特定选项更糟糕; 也就是说,没有其他选项(严格地)的选项首选(通过所有实用程序函数分配较高的实用程序):
允许的选择SET = {a |(∀b∈s)(∃u∈u)(欧武(a)≥euu(b))}
这是一个比电子可否受理的更为允许的规则:每个可允许的选项都是最大的,但不反之亦然。 要查看两条规则之间的差异,请注意,如果决策者有两个可能的排名,a>b>c和c>b>a,那么所有三个选项将是最大的,但只有a和c将被e-andible(没有特定选项明确到b,因此b是最大的;但它的最终是最优选的B,因此B不是电子允许的)。
最终可能性是我们可以选择不受其他行为主导的任何期权(Schick 1979,Gert 2004),其中间隔主导选项具有比其他一些选项的“最糟糕的”值较低的“最佳”值:
允许的选择SET = {a |(∀b∈s)(maxueuu(a)≥minueuu(b))}
这是一个比e-可容许和最大程度更宽松的规则。
在聚集在各种规则之前,不同类型的规则首先查看每个州中的选项'可能的实用程序值; 这就是野兔(2010)拜访的所需的东西。 要了解卓越作用,我们会考虑在每个州,如果我们在每个状态下,我们都会考虑它的票价如何使其成为最有利的假设。 首先,“团”在U中的实用程序函数,以便有一些后果{x,y}这样(∀u∈u)(u(x)= 1&u(y)= 0); 这仅允许每个代表实用程序函数才能完成决策者的偏好。 接下来,采取所有可能的“状态段” - 每个状态中可能的实用程序分配 - 并在每种可能的安排中一起交叉它们以获取“扩展”的实用程序函数集(例如,这将包含E中的每个可能的实用程序函数与每个可能的实用程序功能Not-e耦合的每个可能的实用程序函数)。 然后,IFF A相对于此扩展集中的某些实用程序功能最大化预期实用程序。
4.不精确的概率或歧义
4.1来自不精确概率或歧义的挑战
预期实用能力最大化的第三个挑战认为,主观概率不需要“尖锐”或“精确”,即,不需要是单一,点亮功能。 (在经济学中,这种现象通常被称为模糊性。)对于不精确的概率,有三种历史上显着的动机。
首先是决策者在其决策行为中不同于客观概率对待主观(或未知)概率。 这方面的典型例子是Ellsberg Paradox(Ellsberg 1961,2001)。 想象一下,你面对一个充满90个球的瓮,是红色,黑色和黄色的,从中绘制一个球。 你知道30个球是红色的,但你对黑色和黄色球的比例一无所知。 你喜欢F1还是F2; 你喜欢F3还是F4?
F1:1美元如果球是红色的; $ 0如果球是黑色或黄色的。
如果球是黑色的,则F2:100美元; $ 0如果球是红色或黄色的。
如果球红色或黄色,则F3:100美元; $ 0如果球是黑色的。
F4:1美元如果球是黑色或黄色的; $ 0如果球是红色的。
大多数人似乎(严格地)更喜欢F1至F2,(严格)更喜欢F4至F3。 他们宁愿投注比未知或主观的概率在第一对中的已知或客观概率,红色具有1/3的客观概率,而黑色具有0至2/3的可能的客观概率 在第二对中,黑色或黄色的客观概率为2/3,而红色或黄色的可能客观概率从1/3到1.这些偏好违反了确定的原则。 (要看这一点,请注意,两对行为之间的唯一区别是,第一对在黄色上产生0美元,第二对产生100美元的黄色。)
对于不精确概率的第二个动机是,即使所有相关概率都是主观的,决策者的投注行为也可能取决于证据这些概率的可靠或良好支持。 考虑一个可能押注三个不同网球比赛的决策者:首先,她对球员了解很多,并且知道它们非常匹配; 在第二,她没有任何关于任何球员的人都知道; 在第三个中,她知道这两个玩家中的一个比另一名球员更好,但她不知道哪一个。 在每个比赛中,决策者应该大概应该为每个玩家获胜分配相同的概率,因为她有利于每个人的信息是对称的; 尽管如此,只有在第一场比赛中仍然是理性的,而不是另一两个(Gärdenfors&萨哈林1982;另见Ellsberg 1961)。
对于不精确概率的最终动机是证据并不总是确定精确的概率(Levi 1974,1983; Walley 1991; Joyce 2005; Sturgeon 2008;白色2009; Elga 2010; Elga 2010)。 假设陌生人接近你并从一个袋子中拉出三个物品:常规牙膏管,一个活着的水母和一根旅行牙膏管; 您被要求将概率分配给他拉出的下一个项目将是另一个牙膏管 - 但似乎你缺乏足够的证据来做(Elga 2010)。
4.2提案:概率表示
为了适应决策中的不精确概率,我们需要两种替代方法来代表概率以及在新代表的概率上运行的替代决策规则。 有两种主要方法可以代表不精确的概率。
首先是为每个命题分配间隔,而不是单个数字。 例如,在Ellsberg案例中:
p(红色)= [1/3],
p(黄色)= [0,2 / 3];
p(黑色)= [0,2 / 3]。
第二代是将个人的信仰代表为一系列概率函数。 例如,在Ellsberg案例中:
q = {p∈p|p(红色)= 1/3}
例如,这意味着例如,概率分布p(r,b,y)=⟨1/ 3,0,2 /3⟩和概率分布⟨1/ 3,1 / 3,1/3兼兼容个人信仰的可用证据或可能的“完成”。
每个设定概率表示都会产生间隔表示(假设概率函数集是凸的); 但是,设定概率表示为命题之间的关系提供了更多的结构。 (不同的提案保留了一个精确的概率功能,但改善了效用和概率范围的物体(Bradley 2015;Stefánsson&Bradley 2015,2019);见第5.2节中的讨论。)
4.3提案:决策规则
我们将在如何评估ELLSBERG选择的方面审查决策规则,以概述概率; 为了便于阐述,我们将假设U($ 0)= 0,U($ 100)= 1。 这里的所有提案都相当于欧盟最大化当集合中的单个概率分布时,因此所有人都将在Ellsberg赌博中为F1和2/3分配效用1/3至F4; 它们的重视其他行为如何差异。
4.3.1使用概率集的聚合决策规则
第一种类型的决定规则与每个行为的判决统治规则联系在一起,并产生了完全排名的行为; 调用这些聚合规则。 本节中的规则使用概率集。
在我们讨论这些规则之前,请记住三种聚合规则将有助于完成以完全无知,即,当我们没有任何关于世界的信息时。 第一个是Maximin,它表示选择最高的最低实用程序的选项。 第二个是MaxImax,它可以使用最高的最大实用程序选择选项。 第三,被称为Hurwicz标准,说要为每个选项,最小和最大实用程序的加权平均值,其中重量α∈[0,1]代表决策者的乐观/悲观程度(Hurwicz 1951a):
h(f)=(1-α)(minu(f))+α(maxu(f))
使用SET-概率表示,我们可以将每个概率分布与预期实用程序值相关联,以产生一组预期的实用程序值。 让EUP(F)是F给定概率分布P的预期效用。
一个提案是,行为的价值是其最低预期效用价值; 因此,决策者应最大限度地提高她的最低预期效用(沃尔德1950; Hurwicz 1951B; Good 1952; Gilboa&Schmeidler 1989):
γ-最大最小(f)= minp(邑(f))
此规则也有时被称为MMEU。 对于Ellsberg选择,F1,F2,F3和F4分别为F1,F2,F3和F4的最低预期实用程序分别:1/3,0,1 / 3和2/3。 这些值合理化F1>F2和F4>F3的常见偏好。 相反,最大化她最大预期实用程序的个人 - 谁使用γ-maximax - 将具有反向偏好。
γ-maximin显得太悲观了。 我们可能会使用Hurwicz标准的欧盟模拟:采用最小预期实用程序的加权平均值和最大预期效用,重量α∈[0,1]对应于决策者的悲观程度(Hurwicz 1951b; 1952年; Luce&Raiffa 1957; Ellsberg 2001; Ghirardato等,2003):