形式认识论(五)
罗森斯托克、布鲁纳和奥康纳认为,佐尔曼效应只会影响认知上的“难题”。只是因为我们的两种治疗方法之间的差异很难从数据中辨别出来,所以佐尔曼效应才值得关注。如果新的治疗方法比旧的治疗方法明显优于旧的治疗方法,比如说成功的机会是 0.7,而不是我们上面想象的 0.501,那么它的优越性是否不会被忽视呢?
因此,罗森斯托克、布鲁纳和奥康纳使用不同的“epsilon”值重新运行模拟,即新疗法带来的成功概率的增加。在我们将 epsilon 固定为 0.001 = .501 − .5 之前。但现在我们让它变化最多 0.1。为了简单起见,这次我们只考虑完整的网络与周期,并且我们将医生的数量固定为 10。(每轮的试验数量仍然是 1,000。)
该图显示 y 轴上的“真正共识的概率”与 x 轴上的“Epsilon”。有两条曲线分别标记为“循环”和“完整”。随着 epsilon 从略高于 0.000 变为略高于 0.025,“完整”曲线从略低于 0.9 的概率变为接近 1.0 的概率。当 epsilon 从 0.000 多一点到 0.025 多一点时,“周期”曲线从接近 0.975 的概率变为接近 1.0 的概率。 “循环”曲线从上方开始,并且比“完整”曲线上升得更快,但当 epsilong 达到 0.025 时,它们会聚集在一起。
随着两种治疗方法之间疗效差异的增加,佐尔曼效应消失
观察佐尔曼效应如何随着 epsilon 的增大而缩小。事实上,在这些模拟中,它只能看到约 0.025。
罗森斯托克、布鲁纳和奥康纳还进行了其他变体,以表明如果我们的医学界更大,或者每个医生在共享之前收集更大的样本,佐尔曼效应就会消失。不太可能出现不具代表性的样本并使整个社区灰心丧气。因此,自由共享数据并没有真正的坏处。
那么一个自然的问题是:现实世界的研究界多久会面临佐尔曼效应真正令人担忧的“难题”?罗森斯托克、布鲁纳和奥康纳承认,一些实验室实验也发现了类似的效果,即限制受试者之间的交流会改善认知结果。但他们也强调,佐尔曼效应并不“稳健”,需要出现相当具体的情况(小 epsilon、小研究群体和不太大的样本量)。他们认为,由于上述模型既简单又理想化,因此缺乏鲁棒性应该让我们对它在现实场景中的可能适用性犹豫不决。
5.2 不信任与两极分化
现在让我们转向这些认知网络模型的不同用途。到目前为止,我们的医生更新了彼此的数据,就好像这是他们自己的数据一样。但如果他们互相不信任怎么办?对那些与你观点不同的人不那么完全信任是很自然的。毕竟,他们似乎在某个地方误入歧途。即使没有,他们的观点也可能非法影响了他们的研究。
因此,也许我们的医生不会相信其他人分享的数据的表面价值。相反,假设他们对此不以为然,尤其是当消息来源的观点与他们自己的观点截然不同时。 O’Connor & Weatherall (2018) 和 Weatherall & O’Connor (即将出版) 探索了这种可能性,并发现它可能导致两极分化。社区中的一些医生可能会放弃新的治疗方法,尽管其他人认为它更优越,而不是社区达成共识。
在下面的动画示例中,穿蓝色衣服的医生的可信度高于 0.5,因此他们尝试了新的治疗方法,并与大家分享结果。绿色医生的可信度为 0.5 或以下,但仍然可以说服。他们仍然足够信任蓝色医生来更新他们的结果——尽管他们与产生这些结果的医生的意见分歧越大,他们就越低估这些结果。最后,红色医生完全忽视结果。他们与所有蓝色医生相距甚远,根本不信任他们。
显示了 20 个圆圈的集合;每个圆圈代表一位医生的信任。每个圆圈都限制在一条水平线内,从左侧的 credence 0.0 到右侧的 credence 1.0。中点 0.5 用垂直线标记。最初,圆圈都是绿色或蓝色的。 0.5 中点左侧的那些为绿色,右侧的那些为蓝色。当动画播放时,圆圈向左或向右滑动。当圆穿过 0.5 中点右侧时,它会变成蓝色;当它向左穿过时,它会变成绿色。同时,标记为“Epoch”的计数器从 0 开始向上计数。不久之后,最左边的一些圆圈变成红色,表明它们距离蓝色圆圈太远,无法信任它们。有时,蓝色圆圈会向左移动并足够靠近红色圆圈,使它们再次变成绿色。但是,随着时间的推移,这些圆圈会分成两组:最右侧的蓝色圆圈和左侧的红色圆圈。在动画结束时(第 25 纪元),有 6 个蓝色圆圈位于最右侧,14 个红色圆圈散布在左端,大约在 0.0 到 0.3 之间。 (大多数情况下,最后的 6 个蓝色圆圈一开始就更靠近右侧。但也有一些例外:最后的红色圆圈中,有 3 个开始时比其他最终为蓝色的圆圈更靠近右侧。)
O’Connor-Weatherall 模型中的极化示例
[视频的替代链接]
在这个模拟中,我们到达了一个地步:不再有绿色医生,只有不可说服的红色怀疑论者和高度自信的蓝色信徒。蓝队变得如此自信,他们不太可能靠近任何红队来倾听他们的耳朵。所以我们已经达到了稳定的两极分化状态。
这种两极分化多久发生一次?这取决于社区的规模以及“不信任率”。为了对这个模型进行编程,我们必须根据不同的意见来决定一位医生对另一位医生的数据的折扣程度。这种“不信任率”是模型中的一个可调整参数。
以下是社区规模和不信任率这两个因素如何影响两极分化的可能性。 (请注意,我们在这里只考虑完整的网络。)
该图显示 y 轴上的“极化概率”与 x 轴上的“不信任”。有 4 条曲线,每条曲线对应不同数量的代理:分别为 2、6、10 和 20 个代理。当不信任从 1.0 变为 2.5 时,2 个代理的曲线从概率 0 变为概率略高于 0.4。随着不信任从 1.0 变为 2.5,6 个代理的曲线从概率 0 变为概率 0.9。随着不信任从 1.0 变为 2.5,10 个代理的曲线从概率 0 变为概率高于 0.95。随着不信任从 1.0 变为 2.5,20 个代理的曲线从概率 0 变为略低于 1.0。
两极分化的概率取决于社区规模和不信任率。
因此,医生越倾向于相互不信任,他们就越有可能最终陷入两极分化。这并不奇怪。但较大的社区也更容易两极分化。为什么?
正如 O’Connor 和 Weatherall 所解释的那样,医生越多,在调查开始时出现强烈怀疑论者的可能性就越大:可信度远低于 0.5 的医生。这些医生往往会忽视乐观主义者尝试新疗法的报告。因此,他们锁定了一部分持怀疑态度的人群。
到目前为止,我们已经掩盖了奥康纳和韦瑟罗尔模型的一个重要细节。折扣是如何运作的,医生如何更新折扣证据?当 X 博士向 Y 博士报告数据 E 时,Y 并不简单地以 E 为条件。这意味着他们只相信 X 报告的表面价值。那么他们做什么呢?
为了计算新治疗优越性的更新可信度 p′(H),Y 取 p(H∣E) 和 p(H∣ØE) 的加权平均值。此过程是条件化的一个著名变体,称为 Jeffrey 条件化:
杰弗里条件化
给定先验概率分配 p(H∣E) 和 p(H∣ØE),在以 p′(E) 的确定性水平学习 E 后,对 H 的新的无条件概率分配应为:
p'(H)=p(H∣E)p'(E)+p(H∣ØE)p'(ØE)。
这个公式看起来很像总概率定律(§1.2.1),但有一个关键的区别。加权平均值中的权重不是p(e)和p(¬E)。相反,它们是p'(e)和p'(¬E)。它们是Y分配给X的报告及其否定的更新,已经缩减的概率。
O'Connor&Weatherall(2018)提出了一种用于计算P'(e)和P'(et)(€)的天然公式,我们不会进入这里。我们只需指出,公式的选择对于极化效应至关重要。不信任不一定会引入两极分化的可能性;不信任必须足够强(上图中大于1.0)。必须有一个要点,因为他们的意见差异是如此之大,因此代理商根本不会互相信任。否则,怀疑论者将永远不会完全忽略他们的乐观同事,因此他们的鼓励报告最终会赢得他们的胜利。
这说明了诸如杰弗里(Jeffrey)条件化之类的更新规则的一般问题:要应用它们,我们首先需要确定分配给证据的新概率。从那里我们可以确定其他主张的新概率。但是,这种重要的输入是我们没有规则的。这是正式系统中的一种松散的结局,作为模型用户,这留给了我们。有关这一点的认识论意义的一些讨论,请参见Field(1978)和Christensen(1992)。
有关两极化的两极化方法,请参见DORS(2020,其他互联网资源)。有关网络认识论的其他工作,请参见Zollman(2013)和《社会认识论条目》的第4.3条,以及其中的参考文献。
社会认识论中的其他正式项目包括有关社会和个人理性之间关系的工作(Mayo-Wilson,Zollman和Danks 2011);关于判断汇总/意见集合(Genest and Zidek 1986; List and Pettit 2002; Russell,Hawthorne和Buchak 2015);从他人的信仰中学习(Easwaran等,2016; Bradley 2018);以及有关竞争更新规则的社会利益,例如条件化与推理对最佳解释(Douven and Wenmackers 2017; Pettigrew M.S.,其他互联网资源)。
6。认识论之外的申请
概率理论和认识论逻辑等工具在认识论之外的许多领域都有许多用途。在这里,我们将简要介绍一些例子:如何做出决定,是否存在,以及像“如果……然后……”这样的假设话语。
6.1决策理论
您应该继续阅读本节,还是应该在这里停下来做其他事情?这一切都取决于:您可以通过继续阅读会获得什么,而这些收益将超过做其他事情的收益的几率?决策理论权衡了这些考虑因素,以确定哪种选择是最好的。
要查看称重的工作原理,让我们从一个非常简单的例子开始:押注模具卷的结果。特别是,让我们假设5或6赢得您的19美元,而其他任何结果都会失去10美元。你应该下注吗?我们可以以表格的形式表示您面对的选择:
1-4卷5或6
下注 - $ 10 +$ 19
不要打赌$ 0 $ 0
到目前为止,赌注看起来还不错:您的收益几乎是损失的两倍。但是,桌子并未显示出您失去胜利的可能性的两倍:2/3对1/3。因此,让我们添加此信息:
1-4卷5或6
赌注
- $ 10
p = 2/3
+$ 19
p=1/3
不要打赌
- $ 0
p = 2/3
+$0
p=1/3
现在,我们可以看到,潜在的下注(即损失10美元)的潜在缺点并没有超过潜在的上升空间。您所能赢得的胜利并不是要失去的两倍,但输掉的可能性是两倍。正式地,我们可以表达以下思维方式:
(-10×2/3)+(19×1/3)= - 1/3<0
换句话说,当潜在的损失和收益与各自的概率权衡时,它们的总和不超过0。因此,在此示例中,投注并不能完全屈服。
这是决策理论核心的基本思想,但距离令人满意还有很长的路要走。一方面,此计算假定金钱就是一切,这肯定不是。假设您完全需要$ 29才能让一家公共汽车回家过夜,而您所拥有的只是口袋里的10美元钞票,这本身就没有用(即使是赌场酒吧最便宜的饮料也是11美元)。因此,损失您的$ 10并没有比保持它更糟糕的是 - 您最好无论哪种方式都会破产。但是要获得19美元,现在这对您来说是值得的。如果您只能把公共汽车带回家,那么晚上就不必睡得很粗糙。
因此,我们必须考虑多种多样的价值对您的价值。损失10美元的价值与损失$ 0的价值大致相同,尽管获得19美元的价值要多得多。为了捕获这些事实,我们引入了一个函数u,它代表了各种可能结果的实用性。对您来说,u( - $ 10)≈U( - $ 0),但是u(+$ 19)≫U( - $ 0)。
到底要获得19美元的价值?您是什么(+$ 19)=…,到底是什么?如果我们只是首先设置秤,我们实际上可以回答这个问题。例如,假设我们想确切地知道您在从一无所获到获得100美元的规模上估值19美元。然后,我们设置u(+$ 0)= 0和u(+$ 100)= 1,以便我们的比例范围从0到1。 $ 100而不是19美元。也就是说,假设您可以选择仅交给19美元而没有附加条件的19美元,而不是提供一场(免费的)赌博,如果您赢了100美元,但没有其他任何东西。赢得100美元必须抓住机会而不是保证19美元的$ 100的可能性有多高?考虑到危险的危险 - 将其送回家与睡眠艰难的回家 - 您可能不会承担全额100美元的机会,而不是保证的19美元。假设您最多会接受.01风险,即,赢得全部$ 100的机会至少必须为.99,以便您将保证的19美元以全额100美元的价格交易。好吧,那么,从获得$ 0到获得100美元的规模,您的价值高高为19美元:.99(满分1)。想法以前是Ramsey(1964 [1926])发现的。
我们的完整决策理论依赖于两个功能P和U。概率函数p反映了您认为动作的各种可能结果的可能性,而u表示每个结果的理想程度。面对两个可能的行动方案A和梦之间的选择,以及两个可能的状态,世界可能在S和s中,有四种可能的结果,O1,…,O4。例如,如果您将$ 1押在一块头上的头上,并且确实会抬起头,那么O1的结果就可以赢得$ 1;相反,如果它出现尾巴,则结果O2获得了,您损失了$ 1。因此,这种情况的总体形状是:
S
一个
U(O1)
p(s)
u(o2)
p(¬s)
¬A
u(o3)
p(s)
u(o4)
p(¬s)
为了权衡概率和公用事业,我们然后定义了预期效用的概念:
定义。定义了A,欧盟A(a)的预期效用:
eu(a)= p(s)u(o1)+p(¬s)u(o2)。
ACT ACT的预期效用,欧盟(EU)(!a)也是如此:
eu(€a)= p(s)u(o3)+p(¬s)u(o4)。
(为什么“预期”实用程序?如果您一遍又一遍地遇到相同的决策问题,并且每次选择选项A时,从长远来看,您都可以期望您的普通实用程序大约是欧盟(a)。)相同的想法会扩展对于具有多种方式的情况,可以简单地将列在表中添加并乘以整个过程,从而使事情变得更加简单。当有两个以上可能的操作时,我们只添加更多行并执行同样的操作。
最后,我们的决策理论在以下规范中达到顶峰:
预期的效用最大化
选择具有最高预期实用程序的选项。 (如果有领带,则可以接受任何一种选择。)
我们没有对此规则提出太多论点,只是它“权衡”了每个可能结果的可取性与它将获得的可能性。但是,有多种方式可能会发展这种权衡的想法。这里阐述的一个是由于野蛮人(1954)。它被认为是经济学和心理学等社会科学中经典/正统的方法。然而,哲学家倾向于偏爱野蛮人的基本方法:杰弗里(Jeffrey,1965)开发的“证据”决策理论或某种形式的“因果”决策理论(参见条目)(Gibbard and Harper 1978; Skyrms 1980; Lewis 1980; Lewis 1981;乔伊斯1999)。
这些方法都同意以下广泛的观念:正确的决策规则以线性方式权衡概率和公用事业:乘以添加(请参阅预期实用程序的条目)。 Buchak(2013,2014)最近开创的另一种方法认为,(在)风险上(在)中,将非线性扳手丢给了该方程式(另请参见Steele 2007)。长期以来,人们认为人们的认知局限性需要进一步偏离传统的线性模型(Kahneman和Tversky 1979; Payne,Bettman和Johnson 1993; Gigerenzer,Todd和Group 1999; Weirich 2004)。