粒子物理与核物理实验中的数据分析 杨振伟 清华大学 第一讲:基本概念 24/05/2019
本次讲座的要点 概率 随机变量与函数 期待值、方差 误差传递 24/05/2019
实验的目的是什么? 观察某一过程 的 n 个事例 实验测量 给出每个事例的特征量(能动量,末态粒子数…)。 理论预言 给出上述各特征量的分布,而且可能还会包含自由参数。 24/05/2019
数据背后的物理图像是什么? 原初物理 分辨率 探测效率 本底噪音 实验数据 数据分析专业术语: 事例选择,粒子鉴别,CUT条件,信噪比优化,无偏选择, 效率修正,卷积分辨率,解谱(像)还原… 24/05/2019
如何科学地给出物理结论? 收集数据 数据分析 估计参数值与相应的误差范 围,检验在何种程度上理论 与实验数据相符。 问题:如何评价这种检验? 24/05/2019
举例:测量闪烁体衰减长度 L 光在闪烁体中传播时,具有下列衰减关系 其中,L0 是闪烁体的衰减长度,它是表征闪烁体质量的一项重要指标。 实验上测量衰减长度的方法如下图所示 Q1 Q2 L L2 L1 24/05/2019
举例:测量闪烁体衰减长度(续) 实验采用恒定光源,因此 Q0 为常数,对待测闪烁体 L0 也 为常数。理论上只要在给定一个位置 z,测量闪烁体两端的 电荷输出量即可。但在实际中,往往需要做多点测量。 频数 Q2 Q1Q2 测量次数 理论上是不变的 Q1Q2值, 为什么每次测量都不相同? 能否认为 L0不是常数? 使用概率来量化结论! 24/05/2019
随机事件 在一定的实验条件下,现象 A 可能发生, 也可能不发生,并且只有发生或不发生这样两 种可能性,这是偶然现象中一种比较简单的情 A,简称事件 A。也称随机事例 24/05/2019
随机事例之间的相互关系 A 与 B 之并事例 指事例 A 与 B 中至少有一个出现的事例 如果 A与 B 互斥,则 24/05/2019
文恩图(Venn diagram)检验 24/05/2019
概率的定义 柯尓莫哥洛夫公理:考虑一全集 S 具有子集 A,B,… P(A)称为事 例A的概率 从该公理与文恩图给出的结论可以导出下列概率公式 S B A C 24/05/2019
条件概率 假设 B 出现的概率不为零,在给定 B 的情况下出现 A 的 条件概率定义为 如果 则表明 A 与 B 相互独立。 注意: 两个子集互斥与独立定义不同。 24/05/2019
贝叶斯定理 根据条件概率的定义 而 ,故 贝叶斯定理由 Reverend Thomas Bayes (1702-1761) 首先提出。 而 ,故 贝叶斯定理由 Reverend Thomas Bayes (1702-1761) 首先提出。 24/05/2019
全概率事例与贝叶斯定理 考虑在样本空间 S 中有一子集 B。将样本空间分为互斥的子集 Ai,使得 B S 因此, 表示成概率的形式为 得到全概率事例公式 贝叶斯定理 24/05/2019
例子:如何利用贝叶斯定理 假设对任意一个人而言,感染上AIDS的概率为 考虑任何一次AIDS检查的结果只有阴性(-)或阳性(+)两种 24/05/2019
例子:如何利用贝叶斯定理(续) 利用贝叶斯定理,阳性结果条件下是AIDS患者的概率为 AIDS患者阳性 所有为阳性结果的人 也就是说,你可能没什么问题!? 从你的观点上看:对自己染上AIDS结果的可信度为3.2%。 从医生角度上看:象你这样的人有3.2%感染上了AIDS。 涉及到如何诠释结果(概率)的问题! 24/05/2019
概率含义的诠释 相对频率(频率论者) 主观概率(贝叶斯论者) 假设A,B,…是一可重复实验的结果,则概率就是 两种解释皆与柯尔莫哥洛夫公理相符。 概率的频率解释在数据分析中用起来比较自然,但是… 24/05/2019
频率概率中的问题 A 的定义 实际问题中,统计量总是有限的。P(A)完全取决于A 的划分与总统计量的大小。 概率大小会出现波动。 需要解决好 A 的定义 适当的误差 概率大小会出现波动。 该定义不适用于某些特殊情况 例如:我们可以说“明天有雨”。但是,如果我们根据概率频率定义说“明天可能有雨”,却是一个毫无科学意义的预报。 24/05/2019
贝叶斯理论与主观概率 贝叶斯理论通常用于主观概率问题 通过实验结果改进基于某一理论的信念(后验性的) 如果实验证明P(理论|实验)=0,则表明理论不能接受。 大的P(理论|实验)会增加对理论的信任度。 通过实验结果可以修改 P(理论)。 改进的P(理论)可应用于对重复实验结果的预测。 P(理论|实验)对先验理论的依赖将最终消失。 24/05/2019
主观概率中的问题 主观性:在对同一随机现象的描述中,我的P(理论)与你的P(理论)可能不同 使用主观概率的原因 理论家甲 之理论A 理论家乙 之理论B 使用主观概率的原因 出于绝望 出于无知 出于懒惰 24/05/2019
主观概率的一些特点 主观概率有一些吸引人的地方,例如对于不可重复现象的处理中,显得比较自然 结论中包含了主观上对事件为真的信念! 系统误差(重复实验时仍保持不变); 在该事例出现的粒子是正电子; 自然界是超对称的; 明天将下雨(将来事件的不确定性); 公元1500年元月一日北京下雨(过去事件的不确定性)。 结论中包含了主观上对事件为真的信念! 24/05/2019
频率论者与主观概率 P(938.27195 < 质子质量 < 938.27211 MeV)是什么? 当以质量来判断一实际为质子的粒子类别时 频率论者:质子或非质子 (不知道是哪个) 主观主义者(贝叶斯论者):68%是质子(对知识的陈述) 对主观概率而言,意味着 质子质量的不确定性与从100只球中有68只白球的球 筐里能拿出白球的不确定性一样。 24/05/2019
频率论者与主观概率(续) 如果大多数贝叶斯论者说 巴西赢得2010年足球世界杯冠军的概率为68% 质子质量在938.27195-938.27211MeV内的概率为68% 大陆中国人2020年获诺贝尔奖的概率为68% 那么上述论断的68%就应该理解为结果为真的概率。 能否在频率定义中将质子质量在938.27195-938.27211MeV内 理解成:在整个宇宙中,自然界给出了各种不同的质子质量, 而它们中有68%在938.27195与938.27211MeV之间? 没问题…只不过这是对信心程度的一种表达。 24/05/2019