实验数据处理方法 第一部分:概率论基础 第二章 概率的基本概念
第二章 概率的基本概念 2.1 概率和统计的关系
2.1 概率和统计的关系 两者是紧密相联系的 概率论:纯数学的一个分支,从一些公理和定义出发,用演绎法 (deduction)建立理论; 统计学:应用数学的一个分支,用归纳法(induction)处理问题。 例如:掷硬币的实验: 设p为掷硬币时其正面朝上的概率,则其反面朝上的概率为1-p; 如果预先知道p的值(=1/2),问:在n次投掷中有r次正面朝上的概率是多少?概率论的问题,回答——二项式分布: 如果预先不知道p的值,(可能为1/2,可能为1/2多一点——两个面不完全相同),则需要通过实验来确定p的值:投掷n次,出现了r次正面朝上的情况,p=? 统计学的问题,回答:
2.1 概率和统计的关系 即:p的值可由试验观测推断出来。只是p的一个估计(点估计)等于p? 两组试验给出的 可能不一样,因此,应该用对p的一个区间估计来表示实验结果: 确定区间也是统计学的问题。在计算p1和p2时,需要知道由概率论给出的分布函数的具体形式。
第二章 概率的基本概念 2.2 概率的定义
2.2 概率(Probability)的定义 物理学家的定义:频数极限 数学家的定义:利用集合理论(Set Thoery) 设在某实验中观测到了n个事例,其中种类为E的事例出现了r次,则某事例的种类为E的概率定义为: 数学家的定义:利用集合理论(Set Thoery) 数学上采用集合空间上的概率测度来定义概率 定义Ω是所有可能的事件Ei的一个集合,其中Ei是互斥的(即 它们中的一个发生时,所有其它的事件都不发生),定义事件Ei发生的概率p(Ei)具有如下的性质: 如果p(E)=0, 则表示事件E总不发生; 如果p(E)=1, 则表示事件E总发生;
2.2 概率(Probability)的定义 集合的概念怎样同物理的概率定义对应起来? 集合 测量值的全体 集合 测量值的全体 元素 一组测量中的一次测量值 子集 符合特定条件的多次测量值(可能是 相同的一些测量值) 概率 频数
第二章 概率的基本概念 2.3 随机变量、样本空间
2.3 随机变量、样本空间 随机变量: 其值不能完全确定地预测的变量。 样本空间: 随机变量x的取值空间。 离散型随机变量: 若随机变量X只能取有限数目的值,则称x为离散型随机变量;其中,X的一个取值对应着集合中的一个元素,X的一种可能值的全体对应着集合中的一个子集. 若pi为离散型随机变量x取值为xi的概率:p(x=xi)=pi,则 连续型随机变量: 若随机变量x在有限取间内的取值是连续的,则称x为连续型的随机变量。 连续型随机变量x的取值位于区间[x,x+dx]的概率定义为: 其中,f(x)为概率密度函数p.d.f(probability density function),满足归一化条件
第二章 概率的基本概念 2.4 概率的性质
2.4 概率的性质 以集合理论为基础介绍概率的一些运算规则。 一、集合(set) 集合A的元素(element): 集合是指一些具有相同性质的元素的全体。 集合A的元素(element): 属于集合A的某一元素; 集合A的子集(subset): 如果集合B的任一元素又是集合A的元素,则称B为A的子集; 集合的补集(complement): 设A是样本空间Ω中的任一组元素的集合,则A的补集定义为Ω中所有不属于A的元素的集合,记为: A和B的并集(union): 属于A或属于B元素的集合,记为:
2.4 概率的性质 A和B的交集(intersection): 维因图(Venn Diagram) A B 如果 ,则称A和B为完备集(Exhaustive Sets); 如果 ,则称A和B是互斥集(Exclusive Sets)——正交集。 维因图(Venn Diagram) A B
2.4 概率的性质 例: PP相互作用事例的分类: p+p(2,4,6,…)个带电粒子+(0,1,2,..)个V0粒子 定义: A为至少有一个V0的事例的集合; B为具有两个带电粒子的事例的集合; :没有V0的事例的集合 :具有两个以上带电粒子的事例的集合 :至少有一个V0,或有两个带电粒子,或至少有一个V0且有两个带电粒子的事例的集合; :有两个带电粒子且至少有一个V0的事例的集合.
2.4 概率的性质 二、概率的加法定律(Addition rule of probability) 定义: p(A): 集合A中某一事件发生的概率; p(B): 集合B中某一事件发生的概率; : 属于A或属于B的某一事件发生的概率; : 既属于A又属于B的某一事件发生的概率; 加法定律: 推广到N个集合的情况:A1,A2,…AN,属于至少其中一个集合Ai的某一事件发生的概率(用Venn图来解释)——约当(Jordan)公式: 其中:
2.4 概率的性质 三、条件概率(Conditional probability) 定义: 意义: 条件概率与A和B的交集的关系: 在事件A已经产生的情况下,事件B产生的概率,记为:p(B|A) 意义: 假设A和B是样本空间的两个子集,如果我们只对A中的元素感兴趣,并将样本空间重定义为子集A,在新的样本空间A中子集B的概率称为B相对于A的条件概率。 条件概率与A和B的交集的关系: P(B|A)由下式定义的
2.4 概率的性质 该式的意义可由下面的Venn图说明: N A NA B NB NC 实验上,所有的概率都是条件概率,因为事例都是在一定的实验条件下获取的,只是由于这些条件对所有的事例都相同,因而被认为是无关紧要的。
Traces from a bubble chamber that was used from 1964 to 1972 for research into the smallest constituents of matter. It was installed in "DESY", Hamburg's first ring accelerator. Inside the bubble chamber there was a tank filled with liquid hydrogen. Tiny particles flying through the tank make the hydrogen boil. Hydrogen vaporizes and forms small bubbles along the paths of the particles. These traces were photographed. An analysis of the pictures yielded information about the types of the particles and their properties. (Source: DESY Hamburg)Blasemkammerbild. (Source: DESY Hamburg)
2.4 概率的性质 K++pK0+p K0pK0p 条件概率的例子:K0p散射截面 K0的产生:K++pK0+p 事例数为N - A事件 B事件 K0的产生:K++pK0+p 事例数为N K0的探测:K0+- 事件B 感兴趣的相互作用: K0p K0p 事件A 求:事件A的概率p(A) 只有在观测到事件B的条件下才能确定事件A的产生 既发生了K0p散射又探测到了K0衰变的概率 K++pK0+p K0pK0p +- 探测到的事例数N1
2.4 概率的性质 p(B|A): 在K0p散射发生的条件下K0衰变的概率 其中: :探测效率 Br(K0+- ): K0+- 的分支比 :K0衰变的截面 K0p散射截面:
2.4 概率的性质 四、独立性,乘法定律(Independence, Multiplication Rule) 如果事件B的产生与事件A的产生无关,则称A和B是不相关的(Independent),即 p(B | A) = p(B) 不相关事件的概率乘法定律 如果事件A和B是不相关的,则A和B都发生的概率等于A事件发生的概率乘以B事件发生的概率. 多个事件的不相关性 (定义更复杂)
2.4 概率的性质 B A Ω A和B的不相关性(Independence)可以理解为上面的Venn图 一个推论: 不相关事件的概率加法定律
2.4 概率的性质 互斥性(正交性)不等于不相关性(独立性) 对互斥事件: N A NA B NB NC=0 因为 但是
2.4 概率的性质 五、概率运算的几个例子: 例1:开关网络 :每个开关接通的概率,每个开关的接通是互不相关的,求A、 B两端有电流通过的概率 A B 1 2 3 Ei:第i个开关接通的事件:p(Ei)= , i=1,2,3 有电流流过的事件:2和3同时接通或1接通: 真值表——布尔代数 我们感兴趣的事件(布尔代数): E1 E2 E3 E 1
2.4 概率的性质 利用Venn图来理解: E2 E1 E3 Ω
2.4 概率的性质 概率加法 概率乘法 其中 包含在“多个事件不相关性”的定义中。
2.4 概率的性质 例2:Cerenkov计数器的效率 9只光电倍增管环绕契伦科夫计数器的轴线排列成一圈,当有带电粒子沿计数器轴线穿过时,每个光电倍增管都可探测到粒子所发出的契伦科夫光。 设每只PMT的探测效率为=0.93,且每只PMT对契伦科夫光的探测是相互独立的,求:契伦科夫计数器的效率P
2.4 概率的性质 E:某只PMT有信号输出的事件,p(E)= =0.93 a) 如果要求9只PMT都有输出: p=(p(E))9=9=0.52 概率乘法定律 b) 将9只PMT分成3组,每组有3只,如果每组至少有一只有信号,则认为该组有信号输出,最后要求三组都有信号
2.4 概率的性质 例3:0的探测效率 0 e+e- 对产生过程 e+e- 0 e+e- 对产生过程 e+e- :发生对产生的概率,1- :不发生对产生的概率 E: 发生对产生的事件,p(E)= , 两发生对产生的事件是互不相关的 a)探测到两个的概率: p(2 )=p(E)p(E)= 2 b)没有被探测到的概率:p(0 )=(1- )2 c)只有一个被探测到的概率: E1:第一个被探测到,第二个没有被探测到 E2:第二个被探测到,第一个没有被探测到 p(E1)=p(E2)= (1- ) E1和E2是互斥的事件:两事件同时发生的概率为零 显然: p(2)+ p(1)+ p(0)=1
2.4 概率的性质 d)至少探测到一个的概率:
2.4 概率的性质 六、边缘概率(Marginal probability) A 实验所获取的事例通常可按不同的标准进行分类,如果忽略掉某些分类标准而只考虑在某一种分类标准下某事件出现的概率,则称这种概率为边缘概率 例:粒子的单举产额 设实验事例按A、B两种分类标准可分为:A1,A2,….Am B1,B2,….Bn,且 则Ai的边缘概率定义为 B1 B2 Bn Bn-1 A 同样,Bi的边缘概率定义为
2.4 概率的性质 例:pp相互作用事例的分类 p+p(2,4,6,…)个带电粒子+(0,1,2,..)个V0粒子 分类标准A:事例中有V0 分类标准B:事例中带电粒子的数目 A4 A3 A2 A1 A 10 8 6 4 2 B5 B4 B3 B2 B1 B 如果实验中已测出了概率 ,如 :具有两个带电粒子且具有1个 的概率 则边缘概率P(A1),即有一个 而不管有几个带电粒子的事例的概率为
第二章 概率的基本概念 2.5 贝叶斯(Bayes)定理
2.5 贝叶斯(Bayes)定理 定理:设样本空间被分成了n个互斥的完备事件组Bi,即 B1+B2+…+Bn= 证明:利用概率运算定律 1.根据条件概率的定义 2.根据边缘概率的定义 代入上式即得贝叶斯定理
2.5 贝叶斯(Bayes)定理 贝叶斯定理的例子 由贝叶斯定理 贝叶斯定理给出了两个条件概率p(Bi|A)和p(A|Bi)之间的关系 三个抽屉分别装有金币和银币 B1: 两个金币 B2:一个金币和一个银币 B3:两个银币 随机地选一个抽屉并从中取出一个钱币,假定取出的是一个金币,求同一抽屉中另一个钱币是金币的概率 A:第一次取出金币的事件,另一个钱币也是金币条件要求只能选取B1,即要求的是在A发生的条件下,选择抽屉B1的概率: p(B1|A) 在选定抽屉的情况下,取出一个金币的概率 P(A|B1)=1, p(A|B2)=0.5, p(A|B3)=0 选择某一抽屉的概率 P(B1)=p(B2)=p(B3)=1/3 由贝叶斯定理
2.5 贝叶斯(Bayes)定理 即:如果第一次取出的是一枚金币,则B1被选中的概率增加了一倍 P(Bi):Bi被选中的先验概率(Prior Probability) P(Bi|A): Bi被选中的后验概率(Posterior Probability) P(A|Bi):在Bi下,事件A的似然值(Likelyhood) 参考书: 《概率论引论》,汪仁官,北京大学出版社
第二章习题(答案见上一页所引书中) 1.一盒中有五个球(三白二红),现从中随机取两个。求两个都是白球的概率。 2.盒中有4个白球,6个红球,现从中随机取4个。求取到2个白2个红的概率。 3.掷六颗骰子,得到三对的概率是多少? 4.n人中至少两人有相同生日的概率是多少(假设一年365天)?当n至少为多少时,这个概率大于0.5,即从n个人中找两个人,生日相同的机会同掷硬币接近? 5.四张卡片分别标着1,2,3,4,面朝下放在桌子上。一个自称有透视能力的“人”将用他超感觉能力说出卡片上的号数,如果他是冒充者而只是随机地猜一下,他至少猜中一个的概率是多少?(四个全猜完在翻开卡片检查结果。) 6.一均匀的正四面体,一面全染红色(记为第一面),一面全然黄色(记为的第二面),一面全然蓝色(记为的第三面),而剩下的一面(记为第四面)染红、黄、蓝三色(各占一部分),在桌上将此四面体任意掷一次,考察和桌面接触的那一面上出现什么颜色。设A=红色出现,B=黄色出现,C=蓝色出现。说明A、B、C两两独立,但不是相互独立事件(即不符合三事件相互对立的定义)。 7.甲、乙、丙三人向同一飞机射击。设它们的命中率分别为0.4,0.5,0.7;又设只一人射中,飞机坠毁的概率为0.2,若二人射中,飞机坠毁的概率为0.6,若三人射中,飞机必坠毁,求飞机坠毁的概率。 8.发报台分别以概率0.6和0.4发出信号“·”和“-”。由于通讯系统受到干扰,当发出信号“·”时,收报台未必收到“·”,而是分别以概率0.8和0.2收到信号“·”和“-”;又若,当发出信号为“-”时,收报台分别以概率0.9和0.1收到信号“-”和“·”。求当收报台收到信号“·”时,发报台确实发出信号“·”的概率。