理性选择的规范理论:竞争对手预期的效用

α-最大最小(f)=(1-α)(minp(邑(f)))+α(maxp(邑(f)))

在ELLSBERG选择中,该模型将分配α(2/3)至F2和(1-α)(1/3)+α(1)至F3,分别对F1和F4分别对F1和F4分别进行,如果α<1/2; 如果α>1/2,则优选F1和F4; 如果α= 1/2,则对F1和F4漠不关心。

相反,我们可以假设决策者在评估法案时考虑两次:该法案的欧盟根据她在概率(ESTP)的“最佳估计”,以及作为概率范围的行为的最小欧盟的欧盟; 她还为她估计的概率分布分配了一定程度的舒适程度。 然后,行动的价值将是她最佳估计欧盟和最低欧盟的加权平均值,其最佳估计受到她的信心程度(Hodges&Lehmann 1952; Ellsberg 1961):

e(f)=ρ(estp(邑(f)))+(1-ρ)(minp(邑(f)))

在Ellsberg对中,假设“最佳估计”是黄色和黑色,每个都具有概率1/3,这将为F2和ρ(2/3)+(1-ρ)(1-/ 3)分配给F3,使其分配只要ρ<1,分别对F1和F4分别对F1和F4的作用。

我们还可以结合这两个提案(Ellsberg 2001):

e(f)=ρ(estpeup(f))+(1-ρ)[(1-α)(minpeup(f))+α(maxpeup(f))]

该模型将合理化ρ和α的许多选择的常见偏好(设置ρ= 0或α= 0产生先前提到的模型)。

我们可能会向表示添加额外的结构:到每个概率函数,决策者分配了一定程度的“可靠性”,这跟踪了决策者对自然状态有多少相关信息(Good 1952;Gärdenfors&sahlin 1982)。 决策者选择所需的认知可靠性阈值水平。 然后,她认为在该阈值之上的所有概率函数,并在这些概率函数方面最大化最小预期实用程序(γ-maximin)。 (原则上,在这一步骤中可以使用不同的决策规则。)对于决定是否投注网球匹配的决策者,第一匹配的上述阈值概率函数可以仅包括P(P1Wins)≈0.5,但是对于第二和第三匹配可能还包括p(p1wins)≈0; 因此,在第一匹配中投注P1的比率比在另一个匹配中的P1上的投注更高的值。

4.3.2综合决策规则:Chenquet预期效用

不同类型的规则是Choquet预期效用,也称为累积效用(Schmeidler 1989; Gilboa 1987)。 该规则从函数V开始,它与概率函数一样,obeys v(e)∈[0,1],v(0)= 0,v(1)= 1,并且a⊆b意味着v(a)≤v(a)。 然而,与概率函数不同,V是非添加剂; v并不直接用于计算期望。 (许多经济学家将此功能称为“非附加主观概率函数”。)。 Choquet预期实用程序是依赖依赖家庭的成员(Quiggin 1982,Yaari 1987,Kahneman&Tversky 1979,Tversky&Kahneman 1992,Wakker 2010)。 这个家庭中的函数让ACT的总体总体的事件的重量取决于概率样元素和事件在ACT的顺序中的位置,例如,这是该行为最糟糕的或最佳活动。 正式,设法,让g'= {e1,x1; ...; en,xn}是从最差事件到最佳事件的动作g的重新排序,使得U(x1)≤...≤u(xn)。 G'(因此G)的Chromet预期效用是:

细胞(g')= u(的x1)+

n

σ

我= 2

v(

n

j =我

ej)(u(十一)氯乙烯(西安-1))

如果V是添加剂,则V是(添加)概率函数,CEU减少到欧盟。 如果V是凸(V(e)+ V(f)≤V(EF)+ V(EVF)),则个人是不确定性的。

在Ellsberg示例中,我们给出了p(红色)= 1/3和p(black∨yellow)= 2/3,因此我们可以假设v(红色)= 1/3和v(blackəylow)= 2/3。 “歧义厌恶”的人将分配V(黑色)+ v(黄色)≤V(black∨yellow); 让我们假设v(黑色)= v(黄色)= 1/9。 同样,她将分配v(red∨yellow)+ v(黑色)≤1; 让我们假设v(red∨yellow)= 4/9。

那么行为的价值将是:

细胞(f1键)= 0 + v(红色)(1-0)= 1/3

细胞(f2键)= 0 + v(黑色)(1-0)= 1/9

细胞(f3的)= 0 + v(red∨yellow)(1-0)= 4/9

细胞(f4键)= 0 + v(black∨yellow)(1-0)= 2/3

此分配恢复ELLSBERG偏好。

CEU的公务化使用可分离条件的限制版本(“Cononotonic”肯定原则或“Conoonotonic”权衡一致性):即,当其域中的所有行为都是Conconotonic时,条件只能保持状态,即,当事件最糟糕的排名恰到恰逢所有行为(Gilboa 1987,Schmeidler 1989,Wakker 1989,Chew&Wakker 1996,Köbberling&Wakker 2003;另请参阅Wakker 2010,他还指出了CEU和α-Maximin之间的关系。)

4.3.3从菜单中选择的决策规则

另一种不同类型的提案侧重于从一组替代方案的选择选择允许的选项,而不是完整的选项排名。 与第3.3节中一样,我们可以想象地将集合Q中的每个可能的概率分布视为“委员会成员”,并根据关于委员会意见的事实为选择规则。 (前三个规则是3.3中实用程序函数集规则的版本,并且可以组合以介绍概率/实用程序对集。)

第一种可能性是,在允许某些委员会成员挑选所有替代方案的情况下,允许决策者选择一个行为:以防它相对于该集合中的某些概率函数最大化预期实用程序。 这被称为电子受理(Levi 1974,1983,1986; Seidenfeld,Schervish,&Kadane 2010):

允许的选择SET = {a |(∃p∈q)(∀b∈s)(EUP(a)≥eup(b))}

Levi实际上讲述了一个更复杂的故事,就允许在越来越多的过程中排除的过程方面选择决策者。 首先,该过程从所有选项中选择了e-accisnible的选项。 接下来,该过程从电子允许的选项中选择,只是可以提供的可接受的选项:“最佳”的选项,以保留电子允许的选项(理性代理应该保持她的选择打开的想法)。 最后,该过程从P-允许选项中选择了可允许的可接受选项:最大化最小实用程序的选项。 (请注意,最后一步涉及Maximin,而不是γ-maximin。)

比电子受理性更加允许的统治许可,只要委员会成员不当(严格地)更愿意的委员会没有特别选择。 与实用程序集一样,此规则被称为最大值(Walley 1991):

允许的选择SET = {a |(∀b∈s)(∃p∈q)(eup(a)≥eup(b))}

(有关电子可接受性和最大性之间的差异,请参阅第3.3节。)

更多许可仍然是选择是允许的规则,只要它不是间隔所在的(Schick 1979,Kyburg 1983):其最大值并不低于其他一些行为的最小值。

允许的选择SET = {a |(∀b∈s)(maxpeup(a)≥minpeup(b))}

有一个证据表明γ-maximax意味着电子可否受理; γ-maximin意味着最大值; 电子可否受理性意味着最大值; 和最大暗示间隔的主导地位,参见TROFFAES(2007)。

最终的方法是将歧义解释为不确定性:一个委员会成员具有“真正的”概率函数,但它是不确定的。 如果所有概率函数都同意允许选择选择,那么它是确定的,可以选择; 如果一切都同意它是不允许的选择,那么它必须不允许选择; 如果有些人认为它是允许的,并且其他人认为这是不允许的,它是不可允许的,但是否是允许的(Rinard 2015)。

本节中的这些规则允许,除非另外的规则(例如,Levi的更复杂的故事或来自第4.3.1节的规则之一),否则这些规则允许明显解释Ellsberg选择,因为F1和F2之间的任何选择以及F3和F4之间的任何选择是电子允许,最大和非间隔主导的。

4.4规范性问题

对于那些有利于非尖锐概率的人来说,出现了两套规范性问题。 第一组是认识的:是否是认识学上的理性而不是具有尖锐的概率(白色2009; Elga 2010; Joyce 2011;Hájek&Smithson 2012; Seidenfeld等,2012; Mayo-Wilson&Wheeler 2016年; Schoenfield 2017; Vallinder 2018; Builes等2022; Konek MS。 - 查看其他互联网资源)。

第二组问题问题是实用的。 有些人认为歧义厌恶不是通过实际原因充分发挥的,因此我们没有理由解释它(Schoenfield 2020)。 其他人认为,与非尖锐概率相关的一些特定决策规则导致不良后果,例如,由于第1.2.3节中提到的原则运行原则。 特别感兴趣的是,这些决定规则如何扩展到顺序选择(Seidenfeld 1988a,b; seidenfeld等,1990; Elga 2010; Bradley和Steele 2014; Chandler 2014; Moss 2015;莫斯2015; Sud 2014;垃圾2015)。

5.风险厌恶

5.1风险厌恶的挑战

最终挑战对预期的效用最大化是对徽标本身的常态,即赌博应该受到预期的价值。 特别是,有些人声称,在与欧盟最大化的情况下,人们是有理由受到风险厌恶(或寻求耐心寻求的风险)。

说个人是厌恶金钱(或任何数值好的)如果她更喜欢赌博的后果,以减少“展开”; 通过Rothschild和Stiglitz对Dispreferring卑鄙的卑鄙蔓延的想法(1972)的想法精确地提出了这一概念。 作为一个特殊情况,风险厌恶的人会更喜欢$ X到任何赌场的赌场,其平均货币价值为$ x。 如果欧盟最大化器是风险厌恶的风险,那么她的效用函数将是凹形的(它略微减少,即,每额外美元增加了比以前的美元更少的效用); 如果欧盟最大化器正在努力冒险,那么她的实用功能将是凸(Rothschild&Stiglitz 1972)。 因此,欧盟理论等同于具有减少边际效用功能的风险厌恶。

但是,直观地至少有两种不同的原因可能是厌恶风险的风险。 考虑一个喜欢咖啡的人,但不能容忍多杯。 考虑另一个公差非常高的人,这是第一个几个杯子都像上次一样愉快,但谁有对风险的特殊态度:这将需要一个非常有价值的上行,以便她放弃保证最少数量的杯子。 两者都更喜欢1杯咖啡到0到2之间的硬币翻转,但直观地非常不同的咖啡杯咖啡,并且具有较为不同的原因。 这个例子概括:我们可能会考虑一个容易饱和的人(一旦她有一点钱,每一个额外的比特就越来越小); 另一个人是一个吝啬者 - 他喜欢每一美元就像最后一美元一样 - 但仍然对咖啡饮用者的赌博态度相同。 两者都将不列颠卑鄙的差价,但直观地对金钱的不同态度和这种偏好的不同原因。 在每对全球敏感度(Allais 1953,Watkins 1977,Yaari 1987,Hansson 1988,Buchak 2013)中呼吁第二个人的态度。

这种例子引起了几个问题。 首先,如果欧盟最大化应该解释为什么有人做出特定选择的原因,它应该能够区分这两个原因偏好; 但是,如果可以捕获全局敏感性,则必须通过减少边际效用函数来捕获它,与每对的第一人称相同。 其次,如果一个人采用该决策者对其的内省函数的看法,决策者可能会报告她有宽容咖啡饮用者或吝啬鬼的纯粹功能是线性的偏好 - 但是如果她最大化欧盟,她的实用功能必须是凹形的; 所以欧盟最大化会让她的实用功能错误。 最后,即使一个决策者没有对其实用程序函数的内省访问权限,如果决策者显示全局灵敏度,那么她将有一些无法通过期望实用程序函数捕获的偏好(ALLAIS 1953,Hansson 1988年,Buchak 2013)。

相关担心显示欧盟最大化等同于越来越递减边际效用的风险厌恶的令人不安的含义。 Rabin的(2000)校准定理表明,如果欧盟最大化器在适度赌注赌博中有轻微的风险厌恶,她将不得不在高赌注赌博中荒谬的风险。 例如,如果个人会拒绝赌博{ - $ 100,0.5; 110美元,0.5}在任何财富水平,然后她还必须拒绝赌博{ - $ 1000,0.5; 任何n的$ n,0.5}。

最后,Allais Paradox标识了一组直观但无法被任何期望效用功能捕获的一组偏好(ALLAIS 1953)。 考虑以下两个彩票之间的选择:

l1的:{$ 5,000,000,0.1; $ 0,0.9}

二级:{$ 1,000,000,0.11; $ 0,0.89}

另外,考虑以下两个彩票之间的选择:

第3层:{$ 1,000,000,0.89; $ 5,000,000,0.1; $ 0,0.01}

腰4:{$ 1,000,000,1}

大多数人(严格)更喜欢L1到L2,(严格)更喜欢L4到L3,但没有价值U($ 0),U($ 1M),U($ 5M),这样欧盟(L1)>欧盟(L2)和EU(L4)>欧盟(L3)。 allais偏好违反了独立公理; 当彩票适当地被释放为行为(例如,在诸如100票彩票的绘图之类的事件中定义)时,它们违反了确定的原则或相关的可分离原则。

5.2提案

有许多描述性尝试解释全球敏感度,由规范性问题无趣的人或假设欧盟是正确的规范理论。 最着名的是展望理论(Kahneman&Tversky 1979; Tversky&Kahneman 1992)和广义效用理论(Machina 1982,1983,1987); 其他人在下面的讨论中提到。 请参阅Starmer(2000)概述。

一些规范性建议试图通过使实用功能的输入更细粒度,以满足预期的效用理论内的全球敏感性。 这种“细化战略”的支持者认为,决策者更喜欢L4到L3,因为L3的$ 0结果会引起一个遗憾的是,一个人肯定为100万美元(或者,因为L4包括心理确定性),因此导致的后果描述应该包括这些事实。 因此,L3的正确描述是:

L3:{$ 1,000,000,0.89; $ 5,000,0.1; $ 0和后悔,0.01}

一旦正确描述了这些赌博,就没有与欧盟最大化的直接冲突(Raiffa 1986,Weirich 1986,Schick 1991,Broome 1991,Bermúdez2009,Pettigrew 2015,Buchak 2015)。 何时应享有两个结果,以区分同样的结果是由布鲁姆(1991),Pettit(1991)和Dreier(1996)占据。

认为结果的价值取决于布拉德利和斯特凡斯逊(2017年)的系统所制定的。 他们的提案使用Jeffrey(1965)开发的预期实用理论版本,并由Bolker公务化(1966)。 Jeffrey通过更一般的“可取性”函数des取代实用程序功能,这不仅适用于后果,也适用于前景; 实际上,它并没有区分“终极”后果和前景,因为其投入是命题。 Bradley和Stefánsson建议扩大DES的领域,包括反事实命题,从而允许对命题的偏好可以取决于反应性。 例如,决策者可以愿意“我选择风险的选项并没有得到任何东西,如果我选择不同地”以“我选择风险的选择并没有得到任何东西,我就会得到保证任何东西,如果我选择了不同的话,我就会得到一些保证的合理化ALLAIS偏好。 (顺便提及,他们的提案还可以合理地利用看似违反欧盟的偏好,因为公平考虑,如钻石(1967)的示例中。)

在不同系列的文章中(Stefánsson&Bradley 2015,2019),这些作者再次雇用Jeffrey的框架,但这次扩大了Des的领域包括机会命题(除了事实前景),命题就像“这个命题我得到100美元的是0.5”。 他们认为,一个理性的决策者可以在X的各种机会之间偏好,即使在X获得的假设(她不需要遵守“机会中性”)。 它们通过持有这种危险的想法,即使是理性的代理必须最大化预期的期望,她也不需要具有X的des功能,这是关于关于x的机会命题的阶段功能的期望(她不需要遵守“线性”)。 例如,DES(“我获得100美元”)不需要等于2(“我获得100美元的机会是0.5”))。 (这与最大化的预期期望不相冲突,因为它只涉及特定输入到DES功能的关系,并且与决策者的主观概率不相关。)。 该提议还可以合理化Ellsberg偏好(第4.1节),因为它允许决策者为各种机会命题分配不同的概率(另见Bradley 2015)。

其他提案认为,我们应该拒绝预期效用的聚合规范。 其中最早来自allais本人,谁认为决策者不仅关心赌博的平均效用,而且涉及价值的分散。 他提出,个人最大化预期的效用加上赌博风险的衡量标准,其中包括赌博的标准偏差和其偏差的倍数。 正式的是,如果S代表L和M代表L的标准偏差,则为L的偏差,那么L的实用价值将是(ALLAIS 1953,Hagen 1979):

啊(l)=欧盟(l)+ f(s,是/ s2的)+ε

其中ε是错误术语。 因此,他提出风险是赌博的独立宝贵财产,与其预期的效用相结合(并交易)。 这项提议基本上将赌博的风险视为本身(DIS)本身有价值的财产(在象征性实用程序中也参见Nozick 1993)。

(本章完)

相关推荐