第一章 概率论的基本概念 主讲教师:董庆宽 副教授 研究方向:密码学与信息安全 电子邮件:qkdong@xidian.edu.cn 本科生必修课:概率论与数理统计 第一章 概率论的基本概念 主讲教师:董庆宽 副教授 研究方向:密码学与信息安全 电子邮件:qkdong@xidian.edu.cn 个人主页:http://web.xidian.edu.cn/qkdong/
课程介绍 一、课程解决的问题 二、课程结构与学时安排 三、考核方式与作业要求 四、教材和习题集 五、学习方法
课程介绍 自然界与社会生活中存在两类现象: 确定性现象: 随机现象: 确定性现象和随机现象 在一定条件下必然发生的一类现象,其结果是确定的 1.课程解决的问题 2.课程结构与学时安排 课程介绍 3.考核方式与作业要求 4.教材和习题集 5.学习方法 自然界与社会生活中存在两类现象: 确定性现象和随机现象 确定性现象: 在一定条件下必然发生的一类现象,其结果是确定的 苹果落地; 同种电荷相斥,异种电荷相吸 随机现象: 结果呈现不确定性:如气象变化、购买彩票、成绩分布等 但其中隐藏着一些确定的规律
课程介绍 实例:在相同条件下,用同一支狙击步枪射击同一目标,观察弹着点的情况 得到弹着点分布图,考虑下面三种情况 确定性现象 随机现象 实例 1.课程解决的问题 2.课程结构与学时安排 课程介绍 3.考核方式与作业要求 4.教材和习题集 5.学习方法 实例:在相同条件下,用同一支狙击步枪射击同一目标,观察弹着点的情况 确定性现象 随机现象 实例 巴雷特M82,半自动反器材步枪 得到弹着点分布图,考虑下面三种情况 存在固有偏差,风,瞄准镜等问题 精度高 精度低
课程介绍 单次实验结果不确定,大量实验具有统计规律性 统计规律性: 1.课程解决的问题 2.课程结构与学时安排 课程介绍 3.考核方式与作业要求 4.教材和习题集 5.学习方法 确定性现象 随机现象 实例 统计规律性 单体不可预测性和群体的频率稳定性 存在固有偏差,风,瞄准镜等问题 精度高 精度低 单次实验结果不确定,大量实验具有统计规律性 统计规律性: 在大量重复试验或观察中所呈现出来的固有规律性 随机现象:在个别试验中其结果呈现出不确定性,在大量重复试验中其结果具有统计规律性的现象 单体的不可预测性和群体的频率稳定性
课程介绍 要正确理解随机现象的统计规律性 著名科学家吴大猷(yóu)曾经幽默的举了两个错用概率的例子,我们仅列举1例: 1.课程解决的问题 2.课程结构与学时安排 课程介绍 3.考核方式与作业要求 4.教材和习题集 5.学习方法 要正确理解随机现象的统计规律性 著名科学家吴大猷(yóu)曾经幽默的举了两个错用概率的例子,我们仅列举1例: 一个病人去看病,经检查后医师告诉病人说他需要动手术。病人问这项手术的死亡率怎样?医生说这项手术100个病人有50个要死的,但他立刻安慰病人说,已有50个病人死去了,所以患者不必担心。 错误在于用统计规律来解释单次实验的不确定性 “随机” 和“模糊” 不同: 随机,体现偶然性,结果不确定性 模糊,体现“边界不清楚” ,比如“冷” 和“热” ,“秃” 与“不秃” ,“青年属于哪个年龄段” 等等 确定性现象 随机现象 实例 统计规律性 单体不可预测性和群体的频率稳定性
课程介绍 随机现象是宇宙空间内最为广泛的现象,体现在人们生产生活的各个领域,因而概率论具有广泛的应用 1.课程解决的问题 2.课程结构与学时安排 课程介绍 3.考核方式与作业要求 4.教材和习题集 5.学习方法 随机现象是宇宙空间内最为广泛的现象,体现在人们生产生活的各个领域,因而概率论具有广泛的应用 键盘布局:依据字母在一定历史时期的出现频率 大数据处理、图像处理、气象水文等等 原子周围的电子云轨迹、通信信道中的信号和噪声 梁昌洪校长提到的一个很有意思的现象 当前男女比例大约为0.5128/0.4872=1.0525 女男寿命比例约为73/69=1.0579 非常接近,似乎隐藏某种平衡 概率论与数理统计:是研究和揭示随机现象统计规律性的一门学科。 确定性现象 随机现象 实例 统计规律性 单体不可预测性和群体的频率稳定性
课程介绍 整个课程共分两个部分,48学时,共24次课,3个学分 第一部分: 第二部分: 概率论基础,第1~5章,32学时 1.课程解决的问题 2.课程结构与学时安排 课程介绍 3.考核方式与作业要求 4.教材和习题集 5.学习方法 整个课程共分两个部分,48学时,共24次课,3个学分 第一部分: 概率论基础,第1~5章,32学时 学习如何对随机现象建模,通过引入数学工具来描述、分析和计算概率论相关问题,构成整个概率论的基础理论。 第二部分: 数理统计,第6,7,8(第1、2、3、5节)章,16学时 以概率论为理论基础,根据实验或观察得到的数据,研究随机现象,对研究对象的客观规律性作出种种的估计和判断。
课程介绍 笔试成绩占90%,全校统一考试 平时成绩占10% 作业:每章交一次,每次所有学生全交 数值实验 (matlab)作业: 1.课程解决的问题 2.课程结构与学时安排 课程介绍 3.考核方式与作业要求 4.教材和习题集 5.学习方法 笔试成绩占90%,全校统一考试 平时成绩占10% 作业:每章交一次,每次所有学生全交 尽量交单页便于携带(用订书机装订一下) 整个学期至少交80%的作业 数值实验 (matlab)作业: 上课讲解实验相关知识,布置实验习题 课后matlab实验编程,上交程序和结果(截图) 拟定三次:第1章一次,第2-5章一次,第6-8章一次
课程介绍 教 材: 盛骤,谢式千,潘承毅 编 《概率论与数理统计》浙江大学第四版,高等教育出版社,2008 习题集: 1.课程解决的问题 2.课程结构与学时安排 课程介绍 3.考核方式与作业要求 4.教材和习题集 5.学习方法 教 材: 盛骤,谢式千,潘承毅 编 《概率论与数理统计》浙江大学第四版,高等教育出版社,2008 习题集: 《概率论与数理统计习题全解指南》配浙大四版,高教出版社 《概率论与数理统计同步辅导》配浙大三版,李彩荣、王志平编著,大连理工大学出版社 后续课程: 本课程是《随机信号分析》及通信各专业课程的必备基础
1.课程解决的问题 2.课程结构与学时安排 课程介绍 3.考核方式与作业要求 4.教材和习题集 5.学习方法 1) 充分理解基本概念,掌握知识点及其物理意义,掌握知识体系框架,重点掌握各种概率分布及数理统计方法的应用 2) 背景知识:集合运算,排列组合,微积分 3) 软件工具:MatLab仿真软件 4) 结合作业和其它习题加强理解,提高知识运用能力
第一章 概率论的基本概念 §1.1 随机试验 §1.2 样本空间、随机事件 §1.3 频率与概率 §1.4 等可能概型(古典概型,几何概型) §1.5 条件概率 §1.6 独立性
§1.1 随机试验 随机试验(Random Experimentation): 例子: 最基本的数学模型 研究随机现象的最基本工具 包括各种各样的科学试验,甚至对某一事务的某一特征的观察,记录也认为是一种试验,且具有以下三个特征: (1)可以在相同条件下重复地进行 (2)每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果 (3)进行一次试验之前,不能确定哪一个结果会出现 例子: 抛一枚硬币,观察正面H和反面T出现的情况; 对某路公交车某停靠站登记下车人数; 对某批电子产品测试其输入电压; 对听课人数进行一次登记; 最基本的数学模型 研究随机现象的最基本工具
§1.2 样本空间、随机事件 (一)样本空间 样本空间(Sample Space): 样本点(Sample Point) : 由随机试验的特点2可知,每次试验的所有可能结果是已知的。 样本空间(Sample Space): 将随机试验E的所有可能结果组成一个集合,称为E的样本空间,记为S 样本点(Sample Point) : 样本空间中的元素,即E的每个结果称为样本点 随机试验 样本空间 样本点
§1.2 样本空间、随机事件 样本空间的实例 随机试验 样本空间 样本点 E1:抛一枚硬币,观察正面H,反面T出现的情况 S1= {H,T} S2= {HHH,HHT,HTH,HTT,THH,THT,TTH,TTT} E3:将一枚硬币抛掷三次,观察出现正面的次数 S3= {0,1,2,3} E4:记录电话交换台一分钟内接到的呼叫次数 S4= {0,1,2,3,…} (可列无穷多个) E5:在一批灯泡中任意抽取一次,测试它的寿命 S5={t|t≥0} (取值是连续的) E6:记录某地一昼夜地最高温度和最低温度 S6={(x, y)|T0≤x≤y≤T1,T0表示该地区最低温,T1表示最高温} (取值连续,样本点是二维的) 随机试验 样本空间 样本点
§1.2 样本空间、随机事件 (二)随机事件 随机事件: 事件发生: 在随机试验中不是单纯的观察样本空间的所有元素了事, 常常关心满足某种条件的那些样本点组成的集合 随机事件: 一般的,称试验E的样本空间S的子集为E的随机事件,简 称事件。 事件发生: 在每次试验中,当且仅当这一子集中的一个样本点出现时, 称这一事件发生 随机试验 样本空间 样本点 随机事件 事件发生
§1.2 样本空间、随机事件 几个特殊事件:设样本空间S={s1,s2,…,sn} S中不同事件的总数: 基本事件:由一个样本点组成的单点集 随机试验的任一种可能结果构成一个基本事件,比如A={s5} 基本事件的总数:等于集合S的基数 注意区别:样本点和基本事件,是元素和集合的关系 必然事件:样本空间S作为一个子集,SS,作为事件时总会发生 不可能事件:用空集 表示,不包含任何样本点,也有 S,表示每次试验都 不发生 S中不同事件的总数: 当S中基本事件数有限时,记S中基本事件的个数为|S|,则总数为2|S| 随机试验 样本空间 样本点 随机事件 事件发生 基本事件 必然事件 不可能事件 事件总数
§1.2 样本空间、随机事件 例:916路公交车在电子科大站候车人数 样本空间S={0,1,2,3,…N},N是最大可能上限人数 事件A={至少有20人候车}={20,21,22,…N} S 事件B={恰有5人或8人候车} ={5,8} S 则A(或B)可能发生,可能不发生,称A (B)为S的一个随机事 件 例:随机试验E5,在一批灯泡中任意抽取一次,测试它的寿命 事件A3:“寿命小于1000小时” A3={t|0≤t<1000} 例:随机试验E6,记录某地一昼夜地最高温度和最低温度 事件A4:“最高温与最低温相差10度” A4={(x, y)|T0≤x≤y≤T1,y-x=10}
§1.2 样本空间、随机事件 (三)事件间的关系与事件的运算 (1)包含关系,相等关系 则有A B S 事件用集合来描述 事件间的关系与运算->集合间的关系与运算 根据“事件发生”的含义给出关系与运算在概率论中的含义 设:试验E的样本空间为S,A,B,Ak(k=1,2,..)是S的子集,看以下几种常见的关系和运算 (1)包含关系,相等关系 若有关系A B,则事件B包含事件A。A发生必然导致B发生 例:一枚硬币抛两次,A={第一次是正面},B={至少有一次正面} 则有A B 若有A B且AB,则有A=B,则称事件A与事件B相等 事件间关系的描述方法: 画韦恩图 元素考察法 考察每一个元素的归属 S A B
§1.2 样本空间、随机事件 (2)和事件 事件A∪B={x|xA或xB},称为A与B的和事件 A和B中至少有一个发生时,事件A∪B发生 多个事件的和事件: 为n个事件A1, A2, …, An的和事件 当n→∞时 , 称为可列个事件A1, A2,……的和事件 包含关系 相等关系 和事件
§1.2 样本空间、随机事件 (3)积事件 事件A∩B={x|xA且xB},称为A与B的积事件。 当且仅当A和B同时发生时,事件A∩B才发生,也可简记为AB 多个事件的积事件: 为n个事件A1, A2, …, An的积事件 当n→∞时, 称为可列个事件A1, A2, ……的积事件 包含关系 相等关系 和事件 积事件
§1.2 样本空间、随机事件 (4)差事件 事件A-B={x|xA且xB},称为A与B的差事件。 当且仅当A发生,而B不发生时,事件A-B才发生 差事件的一些等价表示 包含关系 相等关系 和事件 积事件 差事件
§1.2 样本空间、随机事件 (5)两事件互不相容(互斥) 若A∩B= 则称A与B互不相容或互斥 A与B不同时发生 基本事件是两两互不相容的 (6)逆事件(对立事件) ,补集 若A∪B=S且A∩B= 则A与B互为逆事件, 每次试验事件A和事件B有且仅有一个事件发生。 A的逆事件常记为
§1.2 样本空间、随机事件 (7)事件间的运算律 设A,B,C是三个事件,则有 交换律:A∪B=B∪A; A∩B=B∩A 结合律:A∪(B∪C)= (A∪B)∪C; A∩(B∩C)= (A∩B)∩C 分配率:A∪(B∩C)= (A∪B)∩(A∪C); A∩(B∪C)= (A∩B)∪(A∩C) 德•摩根律: 包含关系 相等关系 和事件 积事件 差事件 互不相容 逆事件
§1.2 样本空间、随机事件 例:设A,B为两个已知事件, 事件X满足 ,求X 解: 例: (A-B)∪B=? 利用德摩根率,左边= 再利用分配率,左边= 所以 例: (A-B)∪B=?
§1.3 频率与概率 (一)频率 在实际应用中我们常希望用一个准确的数值来度量在一次试验中某个事件发生的可能性的大小。 这种表征事件在一次试验中发生的可能性大小的数,就称为概率 为此,先看一下与其密切相关的一个概念,频率 (一)频率 频数:设在相同条件下进行了n次试验,其中事件A发生的次数(记为nA)称为A发生的频数 频率:比值nA/n称为事件A发生的频率,记做fn(A),它是一个集合函数,自变量是一个集合 反映了事件A发生的频繁程度
§1.3 频率与概率 频率fn(A)显然有以下几个性质: 证明:右边= = =左边 频率是在有限次试验内的统计量 2°归一性:fn(S)=1 3°若A1, A2, … , Ak是两两互不相容的事件,AiAj=Φ,其中i≠j,则有 fn(A1∪A2∪…∪Ak)=fn(A1)+fn(A2)+…+fn(Ak) 证明:右边= = =左边 频率是在有限次试验内的统计量 是否能用频率来作为事件发生的概率?
§1.3 频率与概率 例:抛硬币实验,一枚硬币抛5次、50次、500次,观察正面出现的频率 表1 试验 序号 n =5 n =50 例:抛硬币实验,一枚硬币抛5次、50次、500次,观察正面出现的频率 表1 试验 序号 n =5 n =50 n =500 nA fn(A) nH 1 2 3 4 5 6 7 8 9 10 0.4 0.6 0.2 1.0 0.8 22 25 21 24 18 27 31 0.44 0.50 0.42 0.48 0.36 0.54 0.62 251 249 256 253 246 244 258 262 247 0.502 0.498 0.512 0.506 0.492 0.488 0.516 0.524 0.494
§1.3 频率与概率 历史上的一些有名的实验 表 2 实验者 n nA fn(A) 德·摩根 2048 1061 0.5181 蒲 丰 4040 0.5069 K·皮尔逊 12000 6019 0.5016 24000 12012 0.5005 实验中对于频率fn(A)有明显规律: 频率有随机波动性,同样的n次试验,频率fn(A)并不同 n较小时波动很大, n增大时趋于稳定 fn(A)在0.5附近随机摆动并逐渐稳定于0.5
§1.3 频率与概率 用Matlab仿真软件模拟抛硬币实验 代码: >> n= 3000~100000000;m=0; for i=1:n t=randperm(2); %生成一个1~2的随机整数排列 x=t-1; %生成一个0~1的随机整数排列 y=x(1); %取x排列的第一个值 if y==0; m=m+1; end p1=m/n p2=1-p1
§1.3 频率与概率 试验次数n 3000 5000 1万 2万 3万 国徽朝上频率 0.5040 0.5006 0.4879 0.4999 0.5046 国徽朝下频率 0.4960 0.4994 0.5121 0.5001 0.4954 试验次数n 5万 10万 100万 1000万 1亿 国徽朝上频率 0.5021 0.4999 0.5001 0.5000 国徽朝下频率 0.4979
§1.3 频率与概率 大量的实验表明,频率具有如下特点: (1) 频率有随机波动性 (2) 事件A发生的频繁程度越大,频率也越大,事件A在一次试验中出现的可能性也越大。 它说明频率可在一定程度上反映事件发生的可能性大小,但无法准确表达 (3) 试验次数n较小时,fn(A)在0和1之间随机波动,波幅较大 因此,此时的频率值没有参考价值 (4) n增大时,fn(A)逐渐稳定于某个常数,对于每个事件A都有这样一个稳定的常数 这种频率的稳定性,就是一种隐藏在随机现象中的统计规律性,并被人们长期的实践所证实
§1.3 频率与概率 思考:用频率的稳定值来表示事件发生的可能性大小是合适的吗? 第五章将证明,大量试验所得频率的稳定值用来描述概率是合理的 fn(A)|n→∞=P(A) 这种收敛是统计意义上的收敛 R.von米泽斯把这个固定数定义为该事件的概率,这就是概率的频率定义。 雅各布伯努利首次给出了证明。 从理论上讲,概率的频率定义是不够严谨的 当无法理论计算时,可以用大量重复实验后的频率稳定值来近似事件发生的概率 测试生产的灯泡的平均寿命,炮弹的可靠性 概率的频率定义似乎并不简洁,也存在一定缺陷,而根据频率的性质假设一些更简单,更直接的关于概率的公理,再由此推导出概率的各种性质和结论,则更为容易被人接受,这就是概率的公理化定义 柯尔莫哥洛夫于1933年给出了概率的公理化定义
§1.3 频率与概率 (二)概率 公理化定义: 设E是随机试验,S是E的样本空间,对于E的每一事件A赋予一个实数,记为P(A),称为事件A的概率,如果集合函数P(•)满足以下条件: 1°非负性:事件A,有P(A)0 2 °规范性:对于必然事件S,有P(S)=1; 3 °可列可加性:设A1, A2, … , Ak , …,是两两互不相容 的事件,即对于i≠j,AiAj=Φ,i,j=1,2,…,则 有P(A1∪A2∪…)=P(A1)+P(A2)+…
§1.3 频率与概率 事件域: 样本空间S是一次实验中所有可能结果的集合 事件是样本空间S的一个子集 但一般不把S的一切子集都作为事件 例如在几何概率中就不能把不可度量的子集作为事件 只要把具有某些限制而又相当广泛的一类S的子集作为事件就够了,这就引出了事件域的概念:
§1.3 频率与概率 定义:设S是样本空间,F是由S的一些子集构成的集合,称F为事件域,如果它满足以下条件: 1. SF; 2. 若AF,则A的补集 F 3. 若对 n=1, 2, …, AnF,则 F 对于事件域F,有: 1)包含空集; 2)F中任意个事件的积事件还在F中; 3)F中任意两事件的差事件还在F中。 F中任意事件A的概率记作P(A)。 概率空间:三元有序总体{S,F,P}就称为概率空间
§1.3 频率与概率 概率基本性质 性质i:不可能事件Φ 的概率 P(Φ)=0 证明:令An=Φ , n=1,2,… 则 ,并且对于i≠j,AiAj=Φ,i,j=1,2,…两两互不相容 由可列可加性得 ∴ 而由定义,P(Φ)0 ∴只有P(Φ)=0 P(A)=0不能推出A=Φ P(A)=1不能推出A=S 详见第2章
§1.3 频率与概率 性质ii:有限可加性 若A1, A2, … , An两两互不相容,则有 P(A1∪A2∪…∪An)=P(A1)+P(A2)+…+P(An) 证:令An+1=An+2=… = Φ, 则有对于i≠j,AiAj=Φ,i,j=1,2,… ,及 ,由可列可加性 P(A1∪A2∪…∪An)=P(( )∪( ))
§1.3 频率与概率 性质iv:事件概率的上界 证:由性质iii,及AS,得P(A)P(S)=1 性质v:逆事件的概率 证: 对于任意事件A, P(A)1 证:由性质iii,及AS,得P(A)P(S)=1 性质v:逆事件的概率 对于任意事件A,P( )=1-P(A) 证: =S-A 而AS 所以有P( )=P(S-A)= P(S)-P(A)=1-P(A) 或S=A∪ ,A =Φ,P(S)=P(A∪ )=P(A)+P( )=1
§1.3 频率与概率 性质vi:加法公式 证:由图知A∪B=A∪(B-AB),而A(B-AB)=Φ 性质vi的推广 对于任意的两事件A, B,有P(A∪B)=P(A)+P(B)-P(AB) 证:由图知A∪B=A∪(B-AB),而A(B-AB)=Φ 由有限可加性的P(A∪B)=P(A∪(B-AB))=P(A)+P(B-AB) 又显然有ABB,由性质iii 右边=P(A)+P(B)-P(AB) 性质vi的推广 若A1, A2, A3为任意三个事件,则有 P(A1∪A2∪A3)=P(A1)+P(A2)+P(A3)-P(A1A2)-P(A2A3)-P(A1A3) +P(A1A2A3) 一般的对于n个事件,A1, A2, … , An可用归纳法证得 P(A1∪A2∪…∪An)=
§1.4 等可能概型 从本节开始,学习古典概率计算,定理和公式,包括古典概型和几何概型,本节探讨最普通的一种情况 先看两个试验: 抛一枚硬币,观察其H,T出现的情况;S={H,T} 抛一枚骰子,观察其出现的点数;S={1,2,3,4,5,6} 这些试验有两个明显特点: (1)S中的元素只有有限个; (2)试验中每个基本事件发生的可能性相同。 这样的试验大量存在,称为等可能概型 由于它是概率论发展初期的研究对象,又叫古典概型。
§1.4 等可能概型 古典概型试验中事件发生的概率计算公式: 设试验E的样本空间为S={e1,e2,…,en},由于每个基本事件发生的可能性相同,即有 P({e1})=P({e2})=…=P({en}) 又由于基本事件是两两不相容的 所以1=P(S)=P({e1}∪{e2}∪…∪{en})==nP({ei}),i=1,2,…,n 即P({ei})=1/n , i=1,2,…,n 若事件A包含k个基本事件,即 ,i1,i2,…,ik是1到n中某k个不同的数,则有
§1.4 等可能概型 例1.古典概型的一般问题 1.等可能概型的判断可根据对称性来考虑一般的排列组合问题都是古典概型 一枚硬币抛三次 (i) 设事件A1:恰有一次出现正面,求P(A1) (ii)设事件A2:至少有一次出现正面,求P(A2) 解:首先正确给出样本空间 S={HHH,HHT,HTH,HTT,THH,THT,TTH,TTT} (i) 事件A1={HTT,THT,TTH } 分析:S中只有有限个元素,由对称性可知 每个基本事件发生的可能性相同――等可能概型 ∴P(A1)=3/8 (ii)先看A2的逆事件 ={TTT} P(A2)=1-P( )=1-1/8=7/8 1.等可能概型的判断可根据对称性来考虑一般的排列组合问题都是古典概型 2.对于“至少…”通常先考察其逆事件
§1.4 等可能概型 例2:放回抽样与不放回抽样 一只口袋有6只球:4只白的,2只红的。从袋中取球两次,每次随机取一只 考虑两种取球方式: 放回抽样:第一次取一只球,观察颜色后放回袋中,搅匀后再取一只 不放回抽样:第一次取一只球不放回袋中,第二次从剩余球中再取一只 分别就以上两种方式求: (i)取到的两只球都是白球的概率; (ii)取到的两只球颜色相同的概率; (iii)取到的两只球中至少有一只是白球的概率。 解:(a)放回抽样的情况 启示:恰当的利用事件间的关系可以简化求解 设事件A:取到的两只都是白球; 事件B:取到的两只都是红球; 事件C:至少一白 则 (i) 相当于求P(A);(ii) P(A∪B)=P(A)+P(B);(iii) P(C)=1-P(B) 所以只要求出事件A和事件B的概率就行了
§1.4 等可能概型 分析:依次从袋中取两球,每一取法为一个基本事件。又样本空间中的元素有限,由对称性每个基本事件发生的可能性相同:等可能概型 ①计算S中元素的个数:第一次6球,第二次6球,由组合乘法原理, 共有6×6=36种 ②A:两次都有4只白球可取,共有4×4=16种 ③B:两次都有2只红球可取,共有2×2=4种 ∴由古典概型公式: P(A)=16/36=4/9 P(B)=4/36=1/9 P(A∪B)=P(A)+P(B)=4/9+1/9=5/9 P(C)=1-P(B)=1-1/9=8/9 (b)不放回抽样的情况 S:6×5=30,A: 4×3=12,B:2×1=2 具体步骤(略)
§1.4 等可能概型 例3,生日悖论 将n只球随机放入N(Nn)个盒子中去. 求每个盒子至多有一只球的概率(设盒子容量不限) 由对称性易知:古典概型 S:共有Nn种不同的放法 A:至多放一只,共有N×(N-1)×(N-2)×…×(N-n+1) 所以P(A)= N×(N-1)×(N-2)×…×(N-n+1)/Nn= 生日问题 设每人的生日在一年365天中任一天是等可能的 任选n个人(n365),生日各不相同的概率: 由公式,概率= 则n个人中至少有两人生日相同的概率p=1- 当n=23时,p=0.507 当n=64时,p=0.997,几乎等于1,60个人的班级以近乎于1的概率有两个人生日相同
§1.4 等可能概型 例4 超几何分布的概率公式 解:S:N件中任取n件(不放回抽样,也不计次序) 例4 超几何分布的概率公式 设有N件产品,其中D件次品,今从中任取n件 问其中恰有k(kD)件次品的概率是多少? 解:S:N件中任取n件(不放回抽样,也不计次序) 共有 种取法,每一取法为一基本事件 注意:符号 为组合数,N,n均为整数, 当N为实数时记做 A:恰有k件次品:相当于在D件次品中任选k件,并在N-D件正品中任选n-k件 共有 件 P(A)=
§1.4 等可能概型 例5 抽签问题 解:(1)放回抽样时 例5 抽签问题 袋中有a只白球,b只红球,k个人依次在袋中取一只球,分别采用放回抽样和不放回抽样的方式,求第i个人取到白球的概率(k<a+b,ik),记为P(B) 解:(1)放回抽样时 第i个人取球不受前i-1个人的影响,因此概率等于白球的个数比上球总数 即P(B)= (2)不放回抽样的情况 第i个人取到白球的取法总数比上总取法数,其中总取法数如下: S:总的取法,k个人各取一只球,每种取法为一个基本事件 共有(a+b) (a+b-1) … (a+b-k+1)= 种取法 事件B发生时,第i个人应取到白球,可以是a只中的任意一只,共有a种情况,对于每一种情况来说,其余k-1个人是从其余a+b-1个球中任取k-1只,由于是不放回抽样,共有 种, 所以事件B发生时可能的取法总数为a× P(B)= 可见概率与i无关,即k个人每人取到白球的概率与取球的先后次序,取球的方式(是否放回抽样)无关,它们机会均等
§1.4 等可能概型 例 一道作业题 解:古典概型 从5双不同的鞋子中,任取4只,这4只鞋子中至少有两只鞋子配成一双的概率是多少? 例 一道作业题 从5双不同的鞋子中,任取4只,这4只鞋子中至少有两只鞋子配成一双的概率是多少? 解:古典概型 为方便分析,先求4只都不配成双的概率p S:共有 种不同的取法 4只都不配成双的概率: 5双鞋中先任选4双,然后每双鞋中任选一只 所以p= 所以至少两只配成双的概率为1-p=1- 或直接求: 有1双配成双: 有两双配成双 所以P(B)=
§1.4 等可能概型 例8 小概率事件与实际推断原理 解:假设接待事件没有规定,而来访者在一周内任一天去接待站是等可能的 例8 小概率事件与实际推断原理 某接待站在某一周曾接待过12次来访,均是在周二和周四进行 问:是否可以推断接待时间是有规定的? 解:假设接待事件没有规定,而来访者在一周内任一天去接待站是等可能的 那么12个来访者分布于一周7天共有712种可能分布 现在12个人均集中在周二和周四两天,共有212种可能情况 因此在没有规定的情况下,12个来访者均集中在周二和周四两天的概率为 212/712=0.0000003,千万分之三,近乎于不可能事件 实际推断原理:根据实践经验,概率很小的事件在一次试验中实际上几乎是不发生的 现在这种小概率事件竟然发生了,所以假设可能不正确,可以推断接待时间是有规定的 (如果2天改为4天,412/712=0.0012,则很难说是小概率事件)
§1.4 等可能概型 几何概型(概率的几何定义) 定义:若试验具有下列两个特征: 几何概型的计算 (1) 样本空间的元素有无限个; (2) 每个样本点的发生具有某种等可能性. 则称此试验为几何概型试验。 几何概型的计算 设试验的每个样本点是等可能落入区域Ω上的随机点M ,且D Ω,则M点落入子区域D(事件A)上的概率为: P(A)=m(D)/m(Ω). 其中m(•)为自然测度 测度可能是长度、面积、体积,甚至是质量,比如均匀分布
§1.4 等可能概型 蒲丰(Buffon)投针实验,用频率估计值 在画有许多间距为d的等距平行线的白纸上,随机投掷一根长为l(ld)的均匀直针,求针与平行线相交的概率,并计算的近似值 解:设针与平行线的夹角为(0),针的中心与最近直线的距离为x(0xd/2)。针与平行线相交的充要条件是x(l/2)sin ,这里x(0xd/2并且0。建立直角坐标系,上述条件在坐标系下将是曲线所围成的曲边梯形区域,总的区域即x和所有可能取值构成的矩形区域,且所有可能取值是机会均等的,符合几何概型,则所求概率为 故可得的近似计算公式 ,其中n为随机试验次数,m为针与平行线相交的次数。
§1.4 等可能概型 Matlab代码 >> clear,clf n=100000000;l=0.5;m=0;d=1; for i=1:n x=(l/2)*sin(rand(1)*pi); y=rand(1)*d/2; if x>=y m=m+1; end p1=m/n pai=2*n*l/(m*d) 确定针与平行线的角度 确定针中心点的位置
§1.5 条件概率 (一) 条件概率的定义 条件概率问题是概率论中,内容最为丰富的一个问题,主要考虑: 在事件A发生的条件下事件B发生的概率。 (一) 条件概率的定义 例1:一枚硬币抛两次,观察其出现H和T的情况 设事件A:“至少有一次为H” 事件B:“两次抛出同一面” 求已知事件A发生的条件下,事件B发生的概率 解:试验本身是古典概型 S={HH,HT,TH,TT} A={HH,HT,TH } B={HH,TT } AB={HH} 在条件概率下,相当于重新确定了样本空间 S=S∩A=A ; B=B∩A=AB 我们记已知事件A发生的条件下事件B发生的概率为P(B|A),则由古典概型的计算方法 P(B|A)= =1/3 而不考虑A时P(B)=2/4=1/2,可见二者不同
§1.5 条件概率 在 P(B|A)= 中, 令分子分母同时除以样本空间中的基本事件数n,则有一般的 P(B|A)= = P(BA)/P(A) 其中P(A)>0,显然对于古典概型上式都成立 于是有如下定义: 定义:设A,B是两事件,且P(A)>0,则称 P(B|A)= 为在事件A发生的条件下,事件B发生的条件概率。 它也符合概率定义的三个条件: 1)非负性:事件B,有P(B|A)0 2)规范性:对于必然事件S,有P(S|A)=1; 3)可列可加性:设B1, B2, … , Bk是两两互 不相容的事件,即对于i≠j,BiBj=Φ, i,j=1,2,…,则有 P( |A)= 条件概率也可称为后验概率,普通的概率称为先验概率,是根据以往实验得到的
§1.5 条件概率 一般的概率的性质都适合于条件概率,区别是必须加上条件,例如: 设A,B,C是三事件, 若BC,则有P(C-B)=P(C)-P(B) 同样的有P((C-B)|A)=P(C|A)-P(B|A) 又P(C∪B)=P(C)+P(B)-P(CB) 则P(C∪B|A)=P(C|A)+P(B|A)-P(CB|A) 一般的,求条件概率有两种思路 《一》用概率的含义,依据条件重新写出样本空间和事件子集 《二》用条件概率的定义,若P(A)>0,则 P(B|A)=
§1.5 条件概率 例2:掷两颗骰子,已知点数之和为7,求有一颗为1点的概率 A:两颗骰子点数之和为7(为条件) B: 有一颗为1点。 求解P(B|A) 解: S:36 A:6 B:11 AB:2 所以所求的条件概率 或由条件概率的含义直接有2/6=1/3
§1.5 条件概率 (二) 乘法定理 (条件概率的推论) 乘法定理:设P(A)>0,则有P(AB)=P(A)P(B|A) (二) 乘法定理 (条件概率的推论) 乘法定理:设P(A)>0,则有P(AB)=P(A)P(B|A) 推广到三个事件的情况:设有A,B,C三个事件,且P(AB)>0,于是: P(ABC)=P(A)P(B|A)P(C|AB) 注意:如果P(AB)>0,则必有P(A)>0及P(B)>0 推广到更多个的情况 设A1, A2, … , An为n个事件,n2,且P(A1A2…An-1)>0,则有 P(A1A2…An)=P(An|A1A2…An-1)P(An-1|A1A2…An-2)…P(A2|A1)P(A1) 乘法定理解决积事件的概率问题,可借助排列组合中的乘法定理来理解概率中的乘法定理 乘法定理主要解决那些完成一项任务需要分多个步骤的情况,把每个步骤的概率相乘就得到完成该事件的概率
§1.5 条件概率 例3:袋中装有r只红球、t只白球,每次从袋中任取一只观察颜色后放回,再放入a只与所取球同色的球。若连续取球四次,求第一、二次取到红球且第三、四次取到白球的概率 解:设A1, A2, A3, A4分别为每次取到红球的事件 取球时:有次序,放回抽样,有添加 则要求的概率是一个积事件的概率 而依据取球的顺序及有添加的情况,按乘法公式从A1开始展开 = 显然,按以上展开顺序,每一个条件概率均可容易求出
§1.5 条件概率 例4:设某光学仪器厂制造的透镜,第一次落下时打破的概率为1/2,若第一次落下未打破而第二次落下打破的概率为7/10,若前两次落下未打破而第三次落下打破的概率为9/10,试求透镜三次落下而未打破的概率 解:首先分析一下所求的问题 设 事件A:第一次落下打破; 事件B:第二次落下打破; 事件C:第三次落下打破。 则所求的概率为 题设条件为P(A)=1/2, , 用乘法定理 =3/200 也可以先求 由于这三次打破是两两互不相容的事件,因此根据有限可加性 进而由乘法定理展开可得结果
§1.5 条件概率 (三) 全概率公式和贝叶斯公式 (1) 全概率公式: 首先看一下关于划分的概念 对应排列组合中的加法,完成一项任务有多种可能的并行情况,这些情况的数目的和就是完成该任务的所有可能情况 对样本空间适当分解的思想,有利于解决稍微复杂一点的概率问题 首先看一下关于划分的概念 定义:设S为试验E的样本空间,B1,B2,…,Bn为E的一组事件。若 (i) BiBj=Φ,i≠j,i,j=1,2,…,n; (ii) B1∪B2∪…∪Bn=S 则称B1,B2,…,Bn为S的一个划分。 ※每次试验,事件B1,B2,…,Bn中有且仅有一个发生 例:S={1,2,3,4,5,6}则划分正确的是 B1={1,2,3} B2={4,5} B3={6} B1={1,2,3} B2={3,4} B3={5,6} B2 S B1 Bn
§1.5 条件概率 全概率公式:设E的样本空间为S,A为E的事件,B1,B2,…,Bn为S的一个划分,且P(Bi)>0(i=1,2,…,n),则 P(A)=P(A|B1)P(B1)+…+ P(A|Bn)P(Bn)= 证:P(A)=P(AS)= P(A(B1∪B2∪…∪Bn)) 由分配率 =P(AB1∪AB2∪…∪ABn) 而对任意的i≠j,i,j=1,2,…,n,有(ABi)(ABj)= ABiBj=Φ 由有限可加性 =P(AB1)+P(AB2)+ …+ P(ABn) 又P(Bi)>0,由乘法定理上式展开得 =P(A|B1) P(B1)+P(A|B2) P(B2)+ …+ P(A|Bn)P(Bn) 在全概率公式中要注意一下几点: 1)条件P(Bi)>0,划分不能是空集 2) B1,B2,…,Bn正好覆盖S中的所有元素 3)在应用上,那些不便直接求某一事件的概 率时,先找到一个合适的划分,再用全概率公式计算 B2 S A B1 Bn
§1.5 条件概率 (2)贝叶斯(Bayes)公式 (计算后验概率问题) 贝叶斯(Bayes)公式 事件A的发生,iff构成S划分的事件B1,B2,…,Bn中的一个发生时才发生,一般在实验之前仅知道Bi的先验概率,那么如果试验后事件A已经发生了,Bi发生的概率又是多少呢?这种问题我们称他为后验概率问题,有利于我们查找事件发生的原因。解决此类问题可采用贝叶斯(Bayes)公式 贝叶斯(Bayes)公式 设E的样本空间为S,A为E的事件, B1,B2,…,Bn为S的一个划分,且P(A)>0,P(Bi)>0(i=1,2,…,n),则 P(Bi|A)= ,i=1,2,…,n 证:由条件概率公式P(Bi|A)=P(BiA)/P(A),再用乘法定理和全概率公 式对分子分母展开即得所求。 P(Bi)是以往的数据分析得到的,称为先验概率 P(Bi|A)是得到信息之后再重新加以修正的概率,叫做后验概率
§1.5 条件概率 例6:对以往数据分析结果表明: 当机器调整良好时, 产品合格率为98% 当机器发生某一故障时,产品合格率为55% 当机器调整良好时, 产品合格率为98% 当机器发生某一故障时,产品合格率为55% 每天早上机器开动时,调整良好的概率为95% 试求:已知某日早上第一件产品是合格产品时,机器调整得良好的概率? 解:设事件A:产品合格 事件B:机器调整良好; :机器出现故障 由题意:P(B)=95%,P( )=5% P(A|B)=98%,P(A| )=55% P(B|A)= =0.97 注意:P(B)=95%是以往的数据分析得到的,称为先验概率 P(B|A)=0.97是得到信息(第一件产品是合格品)之后再重新加以修正的概率,叫做后验概率。通过后验概率可以进一步了解机器的情况
§1.5 条件概率 例:习题38 袋中装有m只正品硬币,n只次品硬币,次品硬币系指两面均印有国徽。 在袋中任取一只,将它投掷r次,已知每次都得到国徽,问这只硬币是正品的概率是多少? 解:由题述这是典型的采用贝叶斯公式的题目 设:事件A:取到的是正品;事件 :取到的是次品 B为r次投掷得到国徽;求P(A|B) P(A|B)= ,P(B| )=1,P(B|A)=(1/2)r 带入得P(A|B)=
§1.6 独立性 在条件概率P(B|A)中,一般情况下,事件A的发生对事件B的发生是有影响的,即在很多情况下P(B|A)≠P(B),在有些情况下,这种影响是不存在的 即 P(B|A)=P(B) 这时P(AB)= P(B|A)P(A)=P(B)P(A) 这样的情况用独立性这一概念来描述 定义 设A,B是两事件,如果具有等式 P(AB)=P(B)P(A) 则称事件A,B相互独立,简称A,B独立 例1: 设试验E为“抛甲乙两枚硬币,观察正反面出现的情况” 设事件A:甲币出现正面; 事件B:乙币出现正面。看一下独立性。 分析: S={HH,HT,TH,TT}; A={HH,HT } B={ HH,TH } ∴P(A)=1/2 P(B)=1/2 P(AB)=1/4 P(B|A)=1/2 ∴P(B)=P(B|A) P(AB)=P(B)P(A) 事实上甲和乙抛硬币是互不干涉的
§1.6 独立性 独立性的相关性质: 若P(A)>0,P(B)>0,则A,B相互独立与A,B互不相容不能同时成立 因为如果互不相容则P(AB) =0,如果又满足相互独立则P(AB)=P(B)P(A)>0。矛盾。 定理一 设A,B是两事件,且P(A)>0,若A,B相互独立,则P(B|A) =P(B),反之亦然。(由定义可直接证得) 定理二 若事件A,B相互独立,则下列各对事件也相互独立。 A与 , 与B, 与 证: ∴ ∴A与 相互独立
§1.6 独立性 推广:三个事件的情况 定义:设A,B,C是三个事件,如果满足等式 注意:仅满足前三个等式的三个事件称为两两相互独立 见习题33 当然,如果事件A,B,C相互独立 则 也相互独立 推广到多个事件 一般的,设A1, A2, … , An为n个事件,n2,如果对于其中的任意两个,任意3个,…,任意n个事件的积事件的概率,都等于各事件概率之积,则称事件A1, A2, … , An相互独立。 包含的等式的个数: 在实际应用中,对于事件的独立性常常根据事件的实际意义来判断,如果两个事件关联很弱也可以看作是独立的。 由定义可以得到以下两点推论: 1.若事件A1, A2, … , An相互独立,n2,则其中任意k(2kn)个事件也是相互独立的。 2.若n个事件A1, A2, … , An(n2)相互独立,则将A1, A2, … , An中任意多个事件换成他们的对立事件,所得的n个事件仍相互独立
§1.6 独立性 例:甲、乙两人进行乒乓球比赛,每局甲胜的概率为p,p1/2,对甲而言,采用三局两胜制有利,还是采用五局三胜制有利?设各局胜负相互独立。
§1.6 独立性 例:甲乙丙三人同时对飞机射击,且相互独立 甲的击中概率为0.4;乙的击中概率为0.5;丙的击中概率为0.7; 飞机被一人击中而击落的概率0.2; 飞机被二人击中而击落的概率0.6; 飞机被三人击中而击落的概率1; 求飞机被击落的概率 解:由题意,令B0,B1,B2,B3分别为无人击中、被一人击中、被两人击中、被三人击中的事件,则关于三人射击击中情况B0 ,…,B3构成样本空间的一个划分,事件A为飞机被击落的概率P(A),则由全概率公式 P(A)=P(A|B0) P(B0)+P(A|B1) P(B1)+P(A|B2) P(B2)+P(A|B3) P(B3) 现在P(A|B1)=0.2,P(A|B2)=0.6,P(A|B1)=1,只需求P(B1),P(B2),P(B3) B1= 甲乙丙射击是相互独立的,所以 P(B1)=P( ) = 同理可求得P(B2),P(B3)
习题 例:盒中有N只从1到N进行编号的球,现在有放回的取回n只球,问这n次取球的号码按升序排列的概率是多少?nN 考虑两种情况(i) 严格升序,(ii)非严格升序 解: (i)严格升序 p= /Nn (ii)非严格升序 按升序的含义,重复的球是连续出现的,从1到N这N个球按升序排放后,每取一个球在该球后面放一个标记,如果是重复t次选取就在该球后放t个标记,这样相当于在N个球后面共插入n个标记。 这样相当于在N-1个球+n个标记的N-1+n个位置上任意选n个位置作为标记,其余球按升序恰好填满其它位置,1号球总是在第一个位置上
习题 例:用频率估计自然对数e 某班有n个人,每人各有一支枪,这些枪外形一样。某次夜间紧急集合,若每人随机地取走一支枪,求没有一个人拿到自己枪的概率? 解:记事件Ai为第i个人拿到自已枪,事件 为第i个人没拿到自己枪,易知: ; , 又记 p0为没有一个人拿到自己枪的概率。 由乘法公式可知 … …
习题 于是 所以 特别地,当n较大时, 。 因此,可随机模拟出没有人拿到自己枪的频率,根据频率的稳定性,近似当做概率,然后去估计自然对数e。并考虑估计精度与人数是否有关系,为什么。算法如下:
习题 具体程序及相关结果如下页图 1、产生n个随机数的随机序列; 2、检验随机列与自然列是否至少有一个配对; 3、对没有一个配对的序列进行累积 t; 4、重复1、2、3步 m 次; 5、估计 具体程序及相关结果如下页图 注:自然常数 e≈2.7183
习题 模拟次数 m 4000 40000 400000 人数 n 50 e 2.7379 2.7313 2.7194 >> m=40000; n=50; t=0; for j=1:m k=0; sui=randperm(n); for i=1:n if sui(i)==i k=k+1; else k=k; end if k==0 t=t+1; t=t; e=m/t e = 2.7313 模拟次数 m 40000 人数 n 1000 2000 5000 e 2.7155 2.7082 2.7202
本章小结
本章小结
作业 Matlab实验作业 选做:汽车和山羊问题(可理论计算,也可以Matlab仿真) 第一次:P24 1,2 ,3,4 编写代码对蒲丰投针实验进行验证,以1次投针为一组,计算圆周率。并通过实验检验针的长度是否对的精度有影响。 编写代码实现取枪实验,估计自然对数e的值,若要e精确到2.71828,取枪人数n至少得多少,并Matlab实验验证。 选做:汽车和山羊问题(可理论计算,也可以Matlab仿真) 现有三扇门,其中一扇门后是一辆车,另外两扇门后是一头山羊。选手从1,2,3,号三扇门中选出一扇(仅标记,不打开),接着主持人再从未标记的两扇门中选出一扇打开,此时,主持人知道每扇门后放着是什么,所以每次主持人都选择后面是羊的那扇门打开。选手有一次改变自己选择的机会。最后,打开选手最终选中的那扇门,以选手最终选中车为获胜。请问选手是否需要改变选择