全概率公式和贝叶斯公式主要用于计算比较复杂事件的概率, 它们实质上是加法公式和乘法公式的综合运用. P(A+B)=P(A)+P(B) A、B互斥 乘法公式 P(AB)= P(A)P(B|A) P(A)>0
B发生总是伴随着A1,A2,A3 之一同时发生, P(B)=P( A1B)+P(A2B)+P(A3B) 例1 有三个箱子,分别编号为1,2,3,1号箱装有1个红球4个白球,2号箱装有2红3白球,3号箱装有3红球. 某人从三箱中任取一箱,从中任意摸出一球,求取得红球的概率. 解:记 Ai={球取自i号箱}, i=1,2,3; B ={取得红球} 1 2 3 运用加法公式得 B发生总是伴随着A1,A2,A3 之一同时发生, 即 B= A1B+A2B+A3B, 且 A1B、A2B、A3B两两互斥 P(B)=P( A1B)+P(A2B)+P(A3B)
P(B)=P( A1B)+P(A2B)+P(A3B) 对求和中的每一项 运用乘法公式得 代入数据计算得:P(B)=8/15 将此例中所用的方法推广到一般的情形,就得到在概率计算中常用的全概率公式.
全概率公式: 设A1,A2,…,An是两两互斥的事件,且P(Ai)>0, i =1,2,…,n, 另有一事件B, 它总是与A1, A2, … ,An之一同时发生,即 , 则
在一些教科书中,常将全概率公式叙述为: 全概率公式: 则对任一事件B,有 称满足上述条件的A1,A2,…,An为完备事件组. 设S为随机试验的样本空间,A1,A2,…,An是两两互斥的事件,且有P(Ai)>0,i =1,2,…,n, 则对任一事件B,有 称满足上述条件的A1,A2,…,An为完备事件组.
“全”部概率P(B)被分解成了许多部分之和. 全概率公式的来由, 不难由上式看出: “全”部概率P(B)被分解成了许多部分之和. 它的理论和实用意义在于: 在较复杂情况下直接计算P(B)不易,但B总是伴随着某个Ai出现,适当地去构造这一组Ai往往可以简化计算.
我们还可以从另一个角度去理解 全概率公式. 某一事件B的发生有各种可能的原因(i=1,2,…,n),如果B是由原因Ai所引起,则B发生的概率是 P(BAi)=P(Ai)P(B |Ai) 每一原因都可能导致B发生,故B发生的概率是各原因引起B发生概率的总和,即全概率公式.
P(B)=P(A1)P(B |A1)+ P(A2)P(B|A2) + P(A3)P(B |A3) 例 2 甲、乙、丙三人同时对飞机进行射击,三人击中的概率分别为0.4、0.5、0.7 .飞 机被一人击中而击落的概率为0.2,被两人击中而击落的概率为0.6,若三人都击中,飞机必定被击落, 求飞机被击落的概率. 设B={飞机被击落} Ai={飞机被i人击中}, i=1,2,3 求解如下: 依题意, P(B|A1)=0.2, P(B|A2)=0.6, P(B|A3)=1 则 B=A1B+A2B+A3B 由全概率公式 P(B)=P(A1)P(B |A1)+ P(A2)P(B|A2) + P(A3)P(B |A3)
为求P(Ai ) , 设 Hi={飞机被第i人击中}, i=1,2,3 可求得: 将数据代入计算得: P(A1)=0.36; P(A2)=0.41; P(A3)=0.14.
于是 P(B)=P(A1)P(B |A1)+ P(A2)P(B|A2)+ P(A3)P(B |A3) =0.36×0.2+0.41 ×0.6+0.14 ×1 =0.458 即飞机被击落的概率为0.458.
稍事休息
实际中还有下面一类问题,是 “已知结果求原因” 1 2 3 或者问: 某人从任一箱中任意摸出一球,发现是红球,求该球是取自1号箱的概率. 1 2 3 1红4白 或者问: 该球取自哪号箱的可能性最大? 这一类问题在实际中更为常见,它所求的是条件概率,是已知某结果发生条件下,求各原因发生可能性大小.
接下来我们介绍为解决这类问题而引出的 贝叶斯公式
有三个箱子,分别编号为1,2,3,1号箱装有1个红球4个白球,2号箱装有2红球3白球,3号箱装有3红球 有三个箱子,分别编号为1,2,3,1号箱装有1个红球4个白球,2号箱装有2红球3白球,3号箱装有3红球. 某人从三箱中任取一箱,从中任意摸出一球,发现是红球,求该球是取自1号箱的概率 . ? 1红4白 2 3 1
一球,发现是红球,求该球是取自1号箱的概率. 2 3 1红4白 ? 某人从任一箱中任意摸出 一球,发现是红球,求该球是取自1号箱的概率. 记 Ai={球取自i号箱}, i=1,2,3; B ={取得红球} 求P(A1|B). 运用全概率公式 计算P(B) 将这里得到的公式一般化,就得到 贝叶斯公式
该公式于1763年由贝叶斯(Bayes)给出. 它是在观察到事件B已发生的条件下,寻找导致B发生的每个原因的概率. 贝叶斯公式: 设A1,A2,…,An是两两互斥的事件,且P(Ai)>0,i=1,2,…,n, 另有一事件B,它总是与A1,A2,…,An 之一同时发生,则 该公式于1763年由贝叶斯(Bayes)给出. 它是在观察到事件B已发生的条件下,寻找导致B发生的每个原因的概率.
贝叶斯公式在实际中有很多应用,它可以帮助人们确定某结果(事件 B)发生的最可能原因.
例 3 某一地区患有癌症的人占0. 005,患者对一种试验反应是阳性的概率为0. 95,正常人对这种试验反应是阳性的概率为0 例 3 某一地区患有癌症的人占0.005,患者对一种试验反应是阳性的概率为0.95,正常人对这种试验反应是阳性的概率为0.04,现抽查了一个人,试验反应是阳性,问此人是癌症患者的概率有多大? 求解如下: 设 C={抽查的人患有癌症}, A={试验结果是阳性}, 则 表示“抽查的人不患癌症”. 已知 P(C)=0.005,P( )=0.995, P(A|C)=0.95, P(A| )=0.04 求P(C|A).
由贝叶斯公式,可得 代入数据计算得: P(C|A)= 0.1066 现在来分析一下结果的意义. 1. 这种试验对于诊断一个人是否患有癌症 有无意义? 2. 检出阳性是否一定患有癌症?
1. 这种试验对于诊断一个人是否患有癌症 有无意义? 如果不做试验, 抽查一人, 他是患者的概率 P(C)=0.005 患者阳性反应的概率是0.95,若试验后得阳性反应,则根据试验得来的信息,此人是患者的概率为 P(C|A)= 0.1066 从0.005增加到0.1066,将近增加约21倍. 说明这种试验对于诊断一个人是否患有癌症有意义.
2. 检出阳性是否一定患有癌症? 试验结果为阳性,此人确患癌症的概率为 P(C|A)=0.1066 即使你检出阳性,尚可不必过早下结论你有癌症,这种可能性只有10.66% (平均来说,1000个人中大约只有107人确患癌症),此时医生常要通过再试验来确认.
下面我们再回过头来看一下贝叶斯公式
当有了新的信息(知道B发生),人们对诸事件发生可能性大小P(Ai | B)有了新的估计. 贝叶斯公式 在贝叶斯公式中,P(Ai)和P(Ai |B)分别称为 原因的验前概率和验后概率. 贝叶斯公式从数量上刻划了这种变化。 P(Ai)(i=1,2,…,n)是在没有进一步信息(不知道事件B是否发生)的情况下,人们对诸事件发生可能性大小的认识. 当有了新的信息(知道B发生),人们对诸事件发生可能性大小P(Ai | B)有了新的估计.
的前科,对他们作案的可能性有一个估计,设为 例如,某地发生了一个案件,怀疑对象有 甲、乙、丙三人. 甲 丙 乙 在不了解案情细节(事件B) 之前,侦破人员根据过去 的前科,对他们作案的可能性有一个估计,设为 偏小 P(A1) P(A2) P(A3) 知道B 发生后 但在知道案情细 节后, 这个估计 就有了变化. P(A1 | B) P(A2 | B) P(A3 | B) 最大 比如原来认为作案可能性较小的某甲, 现在变成了重点嫌疑犯.
请思考下面的一个实际中的问题: 1981年3月30日,一个大学退学学生Hinckley企图对里根总统行刺.他打伤了里根,里根的新闻秘书,以及两个保安人员.在1982年审判他时,Hinckley以精神病为理由作为他无罪的辩护.在18个医师中作证的那位医师是Daniel R.Weinberger.他告诉法院当被诊断为精神分裂症的人给以CAT扫描(计算机辅助层析扫描)时,扫描显示30%的案例为脑萎缩,而只有2%正常人的扫描显示脑萎缩.
Hinckley的辩护律师试图拿Hinckley的CAT扫描作为证据.辩护人争辩说因为Hinckley的扫描展示了脑萎缩,因而他患有精神病的可能性更大些. 在美国精神分裂症的发病率大约为1.5%. 请对Hinckley是否患有精神病作出你的判断.
它们是加法公式和乘法公式的综合运用,同学们可通过进一步的练习去掌握它们. 这一讲我们介绍了 全概率公式 贝叶斯公式 它们是加法公式和乘法公式的综合运用,同学们可通过进一步的练习去掌握它们. 值得一提的是,后来的学者依据贝叶斯公式的思想发展了一整套统计推断方法,叫作“贝叶斯统计”. 可见贝叶斯公式的影响 .