贝叶斯定理补充

示例,表格和证明草图

实施例1:随机药物测试

乔是一个随机选择的大人物成员,其中3%是海洛因用户。 Joe在药物测试中测试了海洛因的阳性,正确识别用户95%的时间,并正确地识别了90%的时间。 为了确定joe使用海洛因(= h)的概率给定肯定测试结果(= e),我们使用值应用贝叶斯定理

灵敏度= pH(e)= 0.95

特异性= 1 - P〜H(e)= 0.90

基线“先前”概率= P(H)= 0.03。

然后计算PE(H)= 0.03×0.95 / [0.03×0.95 + 0.97×0.1] = 0.227。 所以,即使Joe的joe的后测试概率超过用户的七倍以上的人口大超过七倍,而且乔仍然不太可能是一个用户。 (请注意当其初始基线概率开始突出时,如何在相当可靠的测试上呈现相当可靠的测试的概率非常小!)

[回到文字]

实施例2:再次随机药物测试

回想一下,乔,一个人口的随机成员,其中3%使用海洛因,在敏感性0.95和特异性0.90的比赛中测试海洛因阳性。 由于PE(H)= 0.227超过P(h)= 0.03,因此该结果提供了强大的增量证据,以便认为Joe使用海洛因。 然而,这一结论的总证据仍然疲软。 由于海洛因使用如此罕见的人口大,而且在这种情况下测试错误的可能性比较可能比乔是一个用户。

请注意汇总和总证据如何使有关人口中使用基础利用的信息的不同用途。 在提出有关增量确认的问题时,可以完全忽略基本速率,因为它被纳入P(H)和PE(H)。 但是,在向有关总证据的问题时,必须与基本率密切关注,这几乎总是总是提供关于该假设的证据相关信息。 例如,在joe的情况下,低基率沼泽振荡正检测结果。 人们经常通过误认为总证据的增量证据犯下“基率谬误”(Kahneman和Tversky 1973,237-251)。 他们对高度但不是完全,可靠的测试的结果,尽管它提供了一些假设的真实性的确凿证据,即使假设的前一种不可能的性能应导致他们询问手头的案件的测试结果的准确性。

[回到文字]

表3:与总证据相关的措施

p(h)作为Hmultiplicativeadditivenetp(h)/ p(〜h)= o(h)p(h) - p(〜h)= 2 [p(h) - 1/2]余额(h)/ p(h *)= b(h,h *)p(h) - p(h *)= p(h&〜h *) - p(h&h *)o(h)作为hmultiplicativeadditiveneto(h)/ o(〜h)= o(h)2o的总证据(h) - O(〜h)= [p(h) - p(〜h)] / p(〜h)p(h)平衡余量(h)/ o(h *)= b(h,h *)/ b(〜h,〜h *)O(h) - o(h *)= [p(h) - p(h *)] / p(〜h)p(〜h *)

[回到文字]

表4:固定H和变量e的增量证据的测量

p(h)作为Hratiodifferenceyfectiveprivepr(h,e)/ pr(h,〜e)= pe(h)/ p〜e(h)= lr(e,h)pd(h,e) - pd(h,〜e)= pe(h) - P〜E(h)差异(h,e)/ pr(h,e *)= pe(h)/ pe *(h)= lr(e,e *; h)pd(h,e) - pd(h,e *)= pe(h) - pe *(h)O(h)作为Hratiodifferingeffectiveor(h,e)/或(h,〜e)= Oe(h)/ o〜e(h)的总证据

= [p(e&h)p(〜e&〜h)] / [p(e&&h)p(〜e&h)] OD(h,e) - od(h,〜e)

= [p(E&H)/ [P(E&+ H)] - [P(〜E&H)/ p(〜E&+ H)]差直流器(H,E)/或(H,E *)= OE(H)/ OE *(H)

= [P(E *&H)] / [P(E&+ H)P(E *&H)] PD(H,E) - PD(H,E *)

= [P(E&H)/ [P(E&+ H)] - [P(E *&H)/ p(E *&〜H)]

[回到文字]

例3:PR和或或

概率比率和差距率产生关于E递增的相对程度的不同象征,逐步证实H和H *当(a)h预测比h *更强烈地预测e *(b)〜h预测比〜h *更强烈地预测e。 一般情况是:

Pr(h,e)>或(h,e)和或(h *,e)<pr(h *,e),如果且仅if1<lr(h,h *; e)<lr(〜h,〜h *; e)

为了说明,假设在学生年结束时向大学生提供了对基本数学知识的考验。 考试的每个学生都有几何体(= H),代数(= H *),两个受试者的课程,或者根本没有数学课程。 来自大型人口的可靠统计数据表明,学生倾向于通过以下比例通过考试:

H&H * H&〜H *〜H&H *〜H&〜H * e = Pass0.120.0010.3780.001〜E = FAIL0.0030.0050.20.292

大约12%的学生采取两个课程,他们通过97.5%的时间。 占用几何但不是代数的学生(0.6%)的微分比例仅在六个时间中通过一次。 大约58%的学生采取代数但不是几何,他们的速度为65%。 最后,少于30%的学生既不是阶级,他们的时间不到0.4%。 一般来说,单独的代数是一个适度的传递指标,单独几何几何才能促进通过(但它比没有什么),并将几何形状添加到代数之中使得几乎通过几乎通过。 鉴于这些数字,学习学生已通过考试将逐步确认她已经采取了代数的假设以及她已经采取了几何的假设。 Pr和或不同意两个假设中哪一个收到更多增量支持。

PR(H,E)= 1.88>Pr(H *,E)= 1.42

或(h,e)= 2.16<或(h *,e)= 106.2

概率比的比较告诉我们,E比H *为H提供稍微增加的增量证据,而差异比较表明E为H *提供了比H *更多的增量证据。概率比较反映了课程的事实反映了课程的事实几何在代数中的几何是一个越来越好,表明学生都采取了这两个课程。 相比之下,在巨大比率中的伟大,相反的指导差异是由于学生在没有几何形状的情况下具有(44%)的不错机会,因为它们可能已经有代数,但他们几乎没有机会(0.7%)通过代数,因为他们可能根本没有数学。

[回到文字]

示例4:PR和PD之间的差异的插图

概率比和概率差异不同意哪个e逐步证实h和h *当(a)h预测到比h *更强烈地预测e,但(b)h *比h更大。以下是一般情况:

Pr(h,e)>pr(h,e)和pd(h,e)<pd(h,e),如果且仅If1<(pr(h,e)-1)/(pr(h *,e) - 1)<p(h *)/ p(h)

为了说明,假设患者在急诊室中出现严重的头痛,肌肉疼痛和疲劳。 这些症状与莱姆病(= H)一致,在该地区和流感(= H *)中是罕见的,这更为常见。 我们即将学习患者是否发烧(= e)。 表现出患者症状的人的已知统计数据如下:

H&H * H *〜H&H *〜H&H * e = Mever0.0070.0200.1840.004〜E =否Fever0.0010.0020.0800.702

虽然只有3%的人患有莱姆病,但这种疾病伴随着90%的发烧。 患者的大量患者(约27%),患有流感的狂热只有70%的时间。 有些矛盾的是,流感和莱姆病的患者患有诸如单独的莱姆疾病的患者略低于较小的患者(可能是因为流感诱导的FEVERS倾向于迅速地表现出比莱姆病引起的患者)。 鉴于这些统计数据,学习患者发烧逐步证实她患有莱姆病的假设以及她有流感的假设。 PR和PD,不同意两个假设中的哪一个接收到更大的支持增量。

PR(H,E)= 4.19>Pr(H *,E)= 3.27

PD(H,E)= 0.09<Pd(H *,E)= 0.61

根据比率措施,发烧为莱姆病提供更多的增量证据,而不是对流感的影响只是因为发烧伴随着前者伴随着后者伴随着。 然而,根据比率测量,发烧逐步证实患流感的诊断而不是肝脏疾病的诊断。 由于许多患者患有流感的患者而不是来自莱姆疾病,并且由于两种疾病都以高速产生频率,因此H *的概率最终增加了比H的概率更大的绝对量增加。 通常,当两个假设相对于一些证据项目具有相似的预测力时,概率差异测量具有更大的确认递增的确认,其假设是如此可能的。

[回到文字]

示例5:或PD之间的差异的插图

关于在以下条件下,e逐步证实h和h *的相对程度的差距和概率差异产量不同的判决:

Pd(H,E)>Pd(H,E)和或(h,e)<或(h,e),如果且仅IF [p(h&e)p(h)] / [p(〜h *&e)p(h *)]>[p(h&e) - P(h)p(e)] / [p(h *&e) - p(h *)p(e)]>1

为了了解这涉及的内容,想象一下员工可能或可能不高度支付的公司(= H),也可能或可能不会持有缓解的工作(= H *)。 男子(= e)和工资单之间的工作分配如下:

H&H * H *〜H&H *〜H&o H * E = MAN0.0180.1020.0190.162〜e = woman0.0020.0980.0010.598

在这家性别公司中,只有2%的员工有付出良好的缓和工作,其中90%是男性。 备受良好但艰巨的工作占工作人员的20%,这些工作几乎均匀地分裂(51%)和女性(49%)。 另有2%的员工有低工资的缓解就业机会,其中95%是男性。 大多数工人(76%)支付不佳,工作困难。 这些任务压倒了(79%)给女性。 鉴于这些统计数据,学习员工是一个人会逐步证实他所获得良好的假设和他有一个诡计的工作的假设。 PD和或不同意其中哪两个假设从证据中获得了更大的支持增量。

PD(H,E)= 0.18>Pd(H *,E)= 0.08

或(h,e)= 2.36<或(h *,e)= 3.37

概率差异测量具有比H *更高的确认增量的H *。 这在很大程度上是因为(i)经费良好的男性人数,艰巨的工作比低工资,缓和工作的人数大得多,(ii)低工资的人数很大,相对于男性总数很大。 赔率比测量有H *接收(略微)的确认增量比H更大,因为(即)低工资工作或困难的工作与E的柜台指标大致良好,但(ii)缓解的工作远比有效的工作更好E.

[返回正文]

(本章完)

相关推荐