杨振伟 清华大学 第十一讲:解谱法(开拆法)

Slides:



Advertisements
Similar presentations
第七节 心 悸 郑祖平. 一、概述 心悸是一种自觉心脏跳动的不适感或心 慌感。当心率加快时感到心脏跳动不适, 心率缓慢时则感到搏动有力。心悸时,心 率可快、可慢,也可有心律失常,心率和 心律正常者亦可有心悸。 一般认为与心肌收缩力心搏量的变化及 患者的精神状态注意力是否集中等多种因 素有关。
Advertisements

台北縣私立多芮咪托兒所 家 長 手 冊. 序言 親愛的家長 : 關心寶貝與學前教育的過程,是您我共同的 責任;為寶貝創造更美好的明天,是我們共同 的心願。歡迎您的寶貝來本園就讀,並感謝您 對我們的信任與支持。為了使您更了解本園所 的一切,我們特別寫這篇家長手冊,以便您隨 時可以參考,並與學校配合,了解學校的教學.
1/67 美和科技大學 美和科技大學 社會工作系 社會工作系. 2/67 社工系基礎學程規劃 ( 四技 ) 一上一下二上二下三上 校訂必修校訂必修 英文 I 中文閱讀與寫作 I 計算機概論 I 體育 服務與學習教育 I 英文 II 中文閱讀與寫作 II 計算機概論 II 體育 服務與學習教育 II.
中医特色疗法及其在临床 中的应用 静乐县中医院 主治中医师 曹怀奎. 中药熏洗疗法是根据中医辨证论治的原则,依据疾 病治疗的需要,选配一定的中药组成熏蒸方剂,将中药 煎液趁热在皮肤或患处进行熏蒸、熏洗,而达到治疗效 果,是一种祖国医学最常用的传统外治方法。
毛周角化症的植物护理. 引 言 —— 本课题的必要性和可信度  目前 美容市场常用毛周角化症的护理方法:自行使 用去角质沐浴用品,像是磨砂膏、去角质刷、丝瓜 布等等。适度的去角质有一定的帮助,但过头就会 造成皮肤的伤害。过度的摩擦不只会使皮肤受伤, 还会使角质层变得更厚。  我们小组设计了一套天然植物的毛周角化症护理,
佛教陳榮根紀念學校 姜曉霞老師、吳麗媚老師 元朗區小學教師發展日 二年級喜閱寫意校本整合 寫作教學.
政治全球化 促進國際間的了解, 抑或加劇了種族、宗教、文化和政 治實體之間的衝突 ?. 政治全球化 指一個國家或國際的政治事務,由一國或少數國家決定的模 式,逐漸過渡至複雜的跨國以至全球決策模式 政治活動和政治決策跨越國家界限.
第三节 特殊饮食的护理 一、鼻饲法 目的 准备 操作步骤 注意事项 鼻饲法是将导管经鼻腔 插入胃内,从管内注入 流质食物、营养液、水 分和药物的方法。
聖若翰天主教小學 聖若翰天主教小學歡迎各位家長蒞臨 自行分配中一學位家長會 自行分配中一學位家長會.
認識食品標示 東吳大學衛生保健組製作.
全国青少年科技创新大赛 科技辅导员项目组织与实施
后勤保卫竞聘讲演报告 竞聘岗位: 后勤保卫副科长 竞聘人: XX 2014年5月2日.
王同学的苦恼﹗ MC 4.1 诚可贵﹗.
第八章 互换的运用.
第八章 收益分配决策补:案例,习题 本章结构、主要内容、重点难点: 收益分配的原则;程序 收益分配的政策: 影响股利的因素 股利政策的种类
手术切口的分级与抗菌药物的应用 贵阳医学院附属白云医院感染管理科 沈 锋
颞下颌关节常见病.
「健康飲食在校園」運動 2008小學校長高峰會 講題:健康飲食政策個案分享 講者:啟基學校-莫鳳儀校長 日期:二零零八年五月六日(星期二)
湖南省科学技术奖励 推荐工作要求.
致理科技大學保險金融管理系 實習月開幕暨頒獎典禮
吸烟有害健康 课题调查报告 无锡市新安中学初三(4)班.
脊柱损伤固定搬运术 无锡市急救中心 林长春.
2013年二手车市场环境分析.
红花酒精湿敷 用于乳腺癌术后皮瓣坏死的新进展.
結腸直腸腫瘤的認知.
口服给药术 南通大学护理学院基础护理教研室.
經歷復活的愛 約翰福音廿一1-23.
郭詩韻老師 (浸信會呂明才小學音樂科科主任)
班級:夜二技餐旅三甲 組別:第三組 組員:陳芳禾、林文欣、張綺芬、黃龍輝、曾惠淇 指導老師:葉佳聖老師 2011/12/5
在系統完成資料填報後 系統產生所有表件請全數印出 如下載的表件為「空白」文件,請安裝PDF中文字型 ★系統參考畫面:
电气与信息工程学院 学科建设情况汇报
猪生产与综合实训 授课教师:徐元青 联系电话:
五年級上學期 體育課教學方案 設計者:吳文芳.
产后出血 定义:胎儿娩出后24小时内阴道出血≥500ml,称产后出血。 一、病因
广东省高新技术企业培育库入库企业认定(第二批)工作介绍
第二章 人体的营养 第一节 食物中的营养物质. 第二章 人体的营养 第一节 食物中的营养物质.
文学名作与影视改编 郁达夫文学作品及相关影视赏析 授课教师 胡芳.
公務員廉政倫理規範與案例介紹 報告人:法務部 廉政署 防貪組 社會參與科 科長 陳敏森 2017/3/19 1.
務要火熱服事主.
作业现场违章分析.
甄選入學招生 第二階段集體及個別報名系統 系統開放時間:102/6/3 10:00~ 102/6/7 17:00止
蒙福夫妻相处之道 经文:弗5:21-33.
2. 戰後的經濟重建與復興 A. 經濟重建的步驟與措施 1.
好好學習 標點符號 (一) 保良局朱正賢小學上午校.
2014創新創業教育研習營 本梯次限額50名,以報名順序額滿為止!! 課程內容及時間:
关注空巢老人的心理健康 525宿舍.
學生:蔡耀峻、許裕邦 座號:23號、21號 指導老師:黃耿凌 老師
4. 聯合國在解決國際衝突中扮演的角色 C. 聯合國解決國際衝突的個案研究.
6.5滑坡 一、概述 1.什么是滑坡? 是斜坡的土体或岩体在重力作用下失去原有的稳定状态,沿着斜坡内某些滑动面(滑动带)作整体向下滑动的现象。
新陸書局股份有限公司 發行 第十九章 稅捐稽徵法 稅務法規-理論與應用 楊葉承、宋秀玲編著 稅捐稽徵程序.
民法第四章:權利主體 法人 楊智傑.
四年級 中 文 科.
第二章 商业银行资本管理.
聖本篤堂 主日三分鐘 天主教教理重温 (94) (此簡報由聖本篤堂培育組製作).
第五章 三角比 二倍角与半角的正弦、余弦和正切 正弦定理、余弦定理和解斜三角形.
全文检索 墨香简介 平台功能 产品优势 产品对比
聖誕禮物 歌羅西書 2:6-7.
中汇会计师事务所(特殊普通合伙)无锡分所
107年 國中教育會考 准考證資料處理系統 學校版 (集體報名單位) 操作說明
108新課綱教學目標與特色 (一)強化務實致用 (二)落實課程連貫 (三)深化基本職能 (四)符應產業需求 考招連動配套 部定實習科目
任务2.3 平板菌落计数.
陳重佑 Ph.D. 國立臺灣體育學院體育學系(所)助理教授
鋼液冶煉製程介紹.
依撒意亞先知書 第一依撒意亞 公元前 740 – 700 (1 – 39 章) 天主是宇宙主宰,揀選以民立約,可惜他們犯罪遭
百艳图.
新疆维吾尔自治区高校科研计划项目网络管理平台项目申报操作指南
基督是更美的祭物 希伯來書 9:1-10:18.
新疆维吾尔自治区高校科研计划项目网络管理平台项目申报操作指南
經文 : 創世紀一章1~2,26~28 創世紀二章7,三章6~9 主講 : 周淑慧牧師
大學考招新方案與銜接配套措施 【十二年國民基本教育課程綱要宣講】 教育部 大學招生委員會聯合會 108 年 9月.
Presentation transcript:

杨振伟 清华大学 第十一讲:解谱法(开拆法) 粒子物理与核物理实验中的数据分析 杨振伟 清华大学 第十一讲:解谱法(开拆法)

本讲要点 数学公式,反应函数(矩阵) 求反应矩阵的逆 修正因子 正规化的解谱法 估计量的方差与偏置 正规化参数的选择 举例 Tikhonov 规则 MaxEnt 规则

图像还原问题 一个常见的问题:由于实验仪器的原因而出现 图像变形,例如 真实分布 = 真实分布 探测器响应 实验观测分布 如果已知探测器响应(可通过探测器模拟得到探测器响应的形式), 能否还原出不受实验仪器影响的真实分布? Unfolding(解谱法)

解谱问题的表述(1) 考虑随机变量y,目标:寻找概率密度函数f(y) 1)如果已知参数化形式 , 最大似然法 1)如果已知参数化形式   , 最大似然法 2)不知概率密度函数的形式,可以构造直方图 可以构造直方图(M个区间),概率密度函数离散化 第j个区间的概率为 “真实的直方图” 为j(或pj)构造估计量 (参数的数目=区间的数目M) 离散化的p.d.f.

解谱问题的表述(2) 问题:y 的测量不可能没有误差 后果:f(y) 模糊化,峰展宽, 甚至分布形状完全变形。 1)第i个区间的y在第j个区间测量到 (测量分辨率) 2)第i个区间的某些事例没有测量到 (测量效率) 3)某些区间的事例完全测量不到 (接收度) 后果:f(y) 模糊化,峰展宽, 甚至分布形状完全变形。 后果严重时需要考虑解谱法还原真实分布

响应矩阵 真值; 观测值 测量误差的影响可用积分方程表示: 响应矩阵 Rij=P(观测值在第 i 区|真实值在第 j 区) :响应函数,表示真值为y观测值为x的概率 对y求积分即可得到测量值为x的概率 离散化 观测直方图 (期待值) 真实直方图 响应矩阵 Rij=P(观测值在第 i 区|真实值在第 j 区)

响应矩阵 Rij=P(观测值在第 i 区|真实值在第 j 区) 真实直方图 观测数据 离散化的p.d.f. 和数据的期待值 数据: 这里 注意: 是常数, 会受 到统计涨落的影响。 真实直方图 离散化的p.d.f. 观测数据 和数据的期待值

效率、本底 有时,事例可能会不被探测到: 效率 有时,无真实事例发生,也有事例被观测到:本底 i 是在观测直方图上预期的本底数目。 真实直方图第 j 区探测效率 真值 效率 测量值 i 是在观测直方图上预期的本底数目。 有时,无真实事例发生,也有事例被观测到:本底

各关键量汇总 “真实”直方图: M 个区间 概率: 观测直方图的期待值: N 个区间 观测直方图: 响应矩阵: 效率: 预期的本底: 或关联矩阵(各区间不独立)Vij=cov[ni,nj] 一般通过构造 logL 或 2寻求 的估计量,这需要相关的概率理论,例如:泊松分布(各区间独立)

为什么要用解谱法? 一般而言,我们并不需要解谱法,例如当比较现有理论的预期值时,最好是将探测器相应叠加到理论中去。即在预期值中包含探测器效应并与未修正的原始数据 相比较。 但是,不将实验数据进行解谱处理,结果发表后,有关反应矩阵的知识将不在保留。而且,解谱后的分布可以直接与各种理论的预言相比较,也可以与别的实验经过解谱以后的分布相比较。 通常解谱后的结果更为有用,否则当反应矩阵不可恢复时,即使对结果又有新的理论解释,也很难进行理论检验。 在粒子物理研究中,解谱法常用的领域为: 强子结构函数 的谱函数(也就是强子不变质量谱) 强子事例形状分布 粒子多重数分布 ...

为什么用解谱法(举例) 中微子与铁原子核相互作用,产生电子,测量电子的能谱。实验上只可能测量电子在铁中的射程。 解谱法 能量与平均射程的关系 因子修正法:能谱(圆圈)与真值(直方图) 解谱法

响应矩阵的逆 假设 的逆存在: 若数据是泊松分布 则有 最大似然法的估计量为 ? 假设 的逆存在: 若数据是泊松分布 ? 则有 最大似然法的估计量为 若R的非对角元太大,即区间宽度比分辨率要小时,会导致上式有很大的方差,以及在相邻区间产生很强的负关联。

错误的原因(I) 考虑一个简单的例子 解决办法是进行平滑处理,消除无意义的统计涨落。 但平滑会带来偏向性,需要在涨落与偏向性之间找到平衡。

错误的原因(II) 考虑周期分布函数 实际上,非物理的剧烈涨落主要是有高频部分造成的。平滑处理,主要是消除或压低高频部分无意义的涨落。

错误的原因(III) 假设 真的有精细结构 R-1 作用回 应完全恢复精细结构: 但我们没有 只有 (存在涨落) 假设 真的有精细结构 R作用后(理论上) 得到 大部分精细结构被抹平, 但会隐藏精细结构的信息。 R-1 作用回 应完全恢复精细结构: 但我们没有 只有 (存在涨落) R-1“认为”这是隐藏的精细结构信息,不遗余力地恢复这种精细结构,从而造成剧烈的振荡效应。

重新研究最大似然法的解(1) 估计量的平均值 无偏! 计算估计量的方差

重新研究最大似然法的解(2) 利用 RCF 边界做无偏估计量 倒数后得到 ML估计量在所有无偏估计中给出的方差最小。 但这个方差太大了! 与刚才得到的结果一致。 ML估计量在所有无偏估计中给出的方差最小。 但这个方差太大了! 为了减小方差,必须引入一些偏置量 策略:接受小的偏置量(系统误差)以换取大幅 减小方差(统计误差)。

简单方法:修正因子法 对 做相同的分区,并取 通常 ,因此方差不会被放大。 (相当于R-1取为对角矩阵) (R-1)ii=Ci 对 做相同的分区,并取 (相当于R-1取为对角矩阵) (R-1)ii=Ci 与 用蒙特卡罗模拟得到(无本底)。 通常 ,因此方差不会被放大。

修正因子法中的偏置问题 修正因子法的偏置 除非模拟采用的模型无误,使得 ,否则 上式不为零,需要考虑对应的系统误差。 除非模拟采用的模型无误,使得 ,否则 上式不为零,需要考虑对应的系统误差。 注意:该偏置量存在把 拉向 的倾向,造 成模型检验的困难。 1)如果分区宽度  几倍的分辨率,结果不会太坏。 2)实际应用中,中。该方法常用于事例形状变量的分布研究

例子:脉冲形状的还原 将理论(真实)的直方图除以受实验仪器影响 的直方图得到修正因子 将观测直方图乘以修正因子直方图得到理论 = 将观测直方图乘以修正因子直方图得到理论 (真实)的直方图 =

正规化的解谱法 考虑“合理的”估计量,对选定的 满足 将下式求最大值 正则化函数(光滑性的量度) 正则化参量(其选择与给定的 对应) 考虑“合理的”估计量,对选定的   满足 估计量满足该不等式并且最光滑,等价于 将下式求最大值 正则化函数(光滑性的量度) 正则化参量(其选择与给定的 对应)

正规化的解谱法(续一) 另外,要求解谱后对总事例数的估计为无偏的 在约束情况下将下式求最大值 显然, :拉格朗日乘子

正规化的解谱法(续二) 需要正规化函数 以及选取  值的方案。 所得到的估计量的好坏由它们的偏置和方差 来判断。 给出最光滑的解(与数据无关) 给出最大似然解(方差太大) 需要正规化函数 以及选取  值的方案。 Tikhonov 规则 MaxEnt 规则 所得到的估计量的好坏由它们的偏置和方差 来判断。

Tikhonov 规则 取光滑度等于第 k 阶导数平方的均值,有 通常取 k=2,使得 S 约等于曲率平方的平均 值。对直方图而言,也就是 Sov. Math.5(1963)1035 注意:2 阶导数对直方图的第一和最后的区 间没有很好的定义。

Tikhonov 规则(续) 如果在 下,采用Tikhonov(k=2)规则 是 i 的二次项。对 求偏微分,给出线性方 程,得到 估计值与方差。 在高能物理界现有好几个现成的程序:RUN,Blobel, SVD, Höcker,…

最大熵(MaxEnt)规则 另一种表征光滑度的方法基于熵。对于一组概 率而言,熵定义为 所有 相等意味着熵最大(最光滑) Ann. Rev. Astron. Astrophys.24 (1986)127 所有 相等意味着熵最大(最光滑) 有一个 ,其它为零,则意味着熵最小。

最大熵(MaxEnt)规则(续) 用熵作为正规化函数, 有时侯,根据贝叶斯统计 这里,我们仍然采用经典近似: 估计量的好坏 的先验概率密度函数(?) 这里,我们仍然采用经典近似: 估计量的好坏 由偏置,方差来判断。 注意:熵并不取决于区间的顺序。

的方差与偏置 一般来说,决定 的方程是非线性的。当得 到正规函数后,将 在 附近展开 G. Cowan, Statistical 一般来说,决定 的方程是非线性的。当得 到正规函数后,将 在 附近展开 G. Cowan, Statistical Data Analysis, Oxford University Press(1998)

的方差与偏置(续) 利用误差传递得到协方差 以及对偏置的估计量, 此处 而且通常情况下

正规化参数  的选取  决定了置于数据的权重大小以便能与光滑度相比较, = 0 给出最大的光滑估计值,并与数据无关。因此虽然方差为零,但有明显的偏置。而取大的 ,则回到高度振荡无偏的最大似然解。 为了在偏置与方差之间达到最大平衡:选择 使均值误差的平方(MSE)最小 或要求偏置不大于它自身的估计方差 。可以找 到  的值使得

正规化参数选择的重要性

迭代法解谱(Bayes方法) 应用贝叶斯定理

RooUnfold: SVD方法解谱 解谱需要先得到响应矩阵R,并进行求逆。 对于性质不太好的矩阵,SVD方法更可靠一些。

Singular Value Decomposition(SVD)

RooUnfold的下载、编译和使用 RooUnfold中提供了SVD以及Bayes的解谱法。 下载和编译使用方法见网页:http://hepunx.rl.ac.uk/~adye/software/unfold/RooUnfold.html 在training服务器上,已经编译好放到ROOT的库文件目录中,不需要另行下载编译。使用时只要在ROOT脚本文件中加上 gSystem->Load(“libRooUnfold”);

RooUnfoldSvd正规化参数的选择 RooUnfoldSvd中正规化函数的选择实际上是Tikhonov(k=2)规则。 使用RooUnfoldSvd后自动生成UnfoHist.root文件,其中包含d的直方图,从d的直方图可以读出正规化参数,即kterm=k,其中k之后各个bin的值满足均值为0方差为1的高斯分布。 当方差小于(或大于)1时,说明测量值b的误差被低估(或高估)了。 不同的分布、分bin数目以及样本大小都会影响正规化参数的选择。训练响应矩阵的MC数据至少应该是测量数据的10倍以上。 MC数据的分布与真实分布差别不大时,效果最好。 一种做法是,用与真实分布有一定差别但差别不大的分布测试,选定分bin数目以及正规化参数,将该结果直接应用于测量数据。

正规化参数选择的例子 有效部分 非物理振荡部分 在该例子中,kterm选择为12左右。

RooUnfoldSvd例子

例子:Tikhonov规则(k=2)

例子:最大熵(MaxEnt)规则

一个在图像处理中的最大熵例子 最大熵值方法常用于天文观测图像的重建,与点源的偏置较小,易于推广到两维以上的情况。

例子:  的谱函数 由于探测器对两者影响各不相同,因此,需要 用开拆法求出“真实”分布。 — = Tikhonov 规则 修正因子方法 Eur. Phys. J. C11: 599, 1999 由于探测器对两者影响各不相同,因此,需要 用开拆法求出“真实”分布。 — = Tikhonov 规则 修正因子方法

小结 数学上的原理 求反应矩阵的逆 修正因子 正规的解谱过程 估计量的方差与偏置 正规化参数的选择 RooUnfold以及解谱法例子