LHAASO实验数据的整合 - 软件与计算的需求分析

Slides:



Advertisements
Similar presentations
LHAASO 的事例重建和物理分析 马欣华 2016 年高能物理计算与软件会 1. 内容 1.LHAASO 的观测对象 2.LHAASO 的事例重建 3.LHAASO 的物理分析 2.
Advertisements

九年级物理一轮复习 第一章 声现象 知识要点. 1. 声音的产生和传播  ( 1 )声音的产生:声音是由于物体的振动产生的。  凡是发声的物体都在振动。振动停止,发声也停止。  ( 2 )声源:正在发声的物体叫声源。固体、液体、气体 都可以作为声源,有声音一定有声源。  ( 3 )声音的传播:声音的传播必须有介质,声音可以在.
信息的传递 九年级物理 电磁波的海洋. 感 悟 固定电话之间有电话 线连接着,信息是由 电流通过电话线传递 的 移动电话之间没有电 话线连接,它是靠什 么传递信息的?
计算机网络课程总结 一、计算机网络基础 计算机网络定义和功能、基本组成 OSI/RM参考模型(各层的功能,相关概念, 模型中数据传输 等)
羊八井ARGO实验簇射芯位的重建 刘 传 磊 物理与微电子学院.
第一部分 中考基础复习 第一章 声现象.
第二十一章信息的传递 电磁波的海洋 九年级物理.
LHAASO项目电磁粒子探测器实验研究进展
初级会计电算化 (用友T3) 制作人:张爱红.
第三章 数据类型和数据操作 对海量数据进行有效的处理、存储和管理 3.1 数据类型 数据源 数据量 数据结构
第十章 信息的传递 一、电话 1、电话的诞生 1876年贝尔发明了电话。最简单的电话由话筒和听筒组成,话筒能把声信号变成电信号,听筒能把电信号变成声信号。
授课对象:微电子、电子、计算机专业本科生、研究生 先修课:数字逻辑电路、Verilog
Hadoop I/O By ShiChaojie.
面向对象建模技术 软件工程系 林 琳.
大型高海拔宇宙线观测站 通用水电任务与工作进展
Roy Wan PCI MS/s 14-bit 高速数字化仪 Roy Wan
存储系统.
SOA – Experiment 3: Web Services Composition Challenge
大数据管理技术 --NoSQL数据库 HBase 陈 辉 大数据分析技术.
基于VATA160 ASIC的微结构气体探测器 通用便携式电子学设计
NaI(TI)单晶伽马能谱仪实验验证 朱佩宇 2008年1月3日.
大气荧光阵列(WFCA)对第二膝的测量可行性研究以及样机的数据分析
DM8148与DM8127 ISS框架讲解 广州创龙电子科技有限公司
利用Arduino制作定向装置 核科学与技术系 崔伟毅 梁嘉祺
时序逻辑电路实验 一、 实验目的 1.熟悉集成计数器的功能和使用方法; 2.利用集成计数器设计任意进制计数器。 二、实验原理
数据挖掘工具性能比较.
CPU结构和功能.
应用实例 识别Ps & Pt ADTS 压力通道并校验 CPD8000 New MENSOR‘s ADTS: CPA8001.
Simple , Powerful and fee
用event class 从input的root文件中,由DmpDataBuffer::ReadObject读取数据的问题
移相正弦信号发生器设计 采用直接数字综合器DDS发生器的设计 原理:图1是此电路模型图
SOA – Experiment 2: Query Classification Web Service
LHAASO-ED 安装工程设计 主要内容: 中科院高能物理研究所 1. 施工图设计 2. 安装工艺设计 3. 安装工序设计
微机系统的组成.
光子能量线性_不同灵敏层厚度 photon,Cell Size 5x5mm
VisComposer 2019/4/17.
高红移耀变体的GeV-TeV能谱 闫大海 云南天文台 张鹏飞 紫金山天文台.
商业分析平台-语义元数据 用友集团技术中心 边传猛 2013年 11月 06日.
Cassandra应用及高性能客户端 董亚军 来自Newegg-NESC.
实验七 安全FTP服务器实验 2019/4/28.
计算机网络与网页制作 Chapter 07:Dreamweaver CS5入门
3. 分子动力学 (Molecular Dynamics,MD) 算法
陈松战 中科院高能物理研究所 合作者:赵静、刘烨、Diane、何会海、张忠泉、侯超、李秀荣、王玲玉等
201x 公司LOGO LOGO XX公司年终总结 201x/10/18 201x
马玲玲 张寿山 毕白洋 尹丽巧 高能物理研究所 LHASSO宇宙线能谱展望 马玲玲 张寿山 毕白洋 尹丽巧 高能物理研究所 第三届LHAASO合作组会议.
核探测与核电子学国家重点实验室 中国科学技术大学近代物理系 王照琪
GPU based online noise filtering algorithm in LHASSO-WCDA
LHAASO-WCDA事例重建工作进展 LHAASO 合作组会 王晓洁 2017/09/22.
LOGIX500软件入门 西安华光信息技术有限公司 2008年7月11日.
魏新宇 MATLAB/Simulink 与控制系统仿真 魏新宇
LHAASO-WCDA 项目工作进展 陈明君 中国物理学会高能物理分会第十二届全国粒子物理学术会 安徽·合肥.
基于MySQL的PMT信息管理系统 于艳红 王旭 冯存峰 山东大学.
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
LHAASO-WCDA探测器模拟工作进展
INSTITUTE OF HIGH ENERGY PHYSICS
中国科学院“核探测技术与核电子学”重点实验室
滤波减速器的体积优化 仵凡 Advanced Design Group.
Timing & charge yield of Surface and Bulk event
基于列存储的RDF数据管理 朱敏
2.4 让声音为人类服务.
LHAASO合作组会议,2017,威海 LHAASO触发设置与物理目标的衔接 马欣华 2017年9月21日.
Continuous Authentication for Voice Assistants
Event Start Time Determination
KM2A-WCDA 联合观测电子能谱预期 武莎 2018年3月22日.
FH实验中电子能量分布的测定 乐永康,陈亮 2008年10月7日.
FVX1100介绍 法视特(上海)图像科技有限公司 施 俊.
B12 竺越
反应显微谱仪的飞行时间测量 暨数据获取系统的研究
入侵检测技术 大连理工大学软件学院 毕玲.
DSP技术与应用 电子与信息技术系.
Presentation transcript:

LHAASO实验数据的整合 - 软件与计算的需求分析 高能物理研究所 姚志国 2013/07/06,威海

内容提要 LHAASO实验的特点 模拟样本的综合 软触发的实现 数据实时在线处理 离线快速分析 算法革新

传统宇宙线实验计算机软件的特点 软件规模小: 不受重视: 研发工具简陋: 但LHAASO必须要颠覆这一传统: 一般<100,000行。 支持力度小; 小作坊式,一般由少数几个物理人员兼做LHAASO的现状。 研发工具简陋: 除corsika、root、geant4外,基本不用其它软件包、数据库 和维护、测试等工具。 但LHAASO必须要颠覆这一传统: 数据量大且复杂; 依靠国内强大的加速器实验的帮助:借鉴经验并吸取人力。

LHAASO实验的组成 主要包含4种探测器: 探测器间相对独立: KM2A:平方公里阵列,5635个ED,1221个MD。 WCDA:水契仑柯夫阵列,3600个单元。 SCDA:簇芯探测器:452个单元。 WFCTA:广角契仑柯夫望远镜:24台,1024个像素/台。 探测器间相对独立: 探测器单元结构; 阵列布局; 标定系统或方式; 电子学系统; 实验工作承担人员。

探测器的功能不同 探测器 KM2A WCDA SCDA WFCTA 主要探测对象 电子、子 光子、电子、子 高能光子、强子 大气契仑柯夫光 关注的物理过程 簇射横向 簇芯 簇射纵向 主要物理目标 伽玛天文 宇宙线 主要研究对象 河内源 河外源 宇宙线成份 宇宙线能谱 主要工作能区 10-1000 TeV 0.1-50 TeV 0.1-10 PeV 100 TeV-1 EeV

关联程度不同 相对来说: KM2A最受依赖; KM2A、WCDA的依赖性最弱; WFCTA的依赖性最强(因而,整合性最强)。 依赖对象 SCDA WFCTA - 弱 无 强 相对来说: KM2A最受依赖; KM2A、WCDA的依赖性最弱; WFCTA的依赖性最强(因而,整合性最强)。

模拟数据样本的整合:产生器(暂定方案) 统一坐标系 统一空气簇射产生器(部分事例): 基于各个探测器最高需求:尤其WCDA(最低阈能)和WFCTA (需产生大气契仑柯夫光); 簇射本身信息(粒子种类、能量、方向、阈值); 芯位信息:固定位置(比如WFCTA的产生器就已经采样)或在阵 列范围内随机抽取; 针对不同物理目标,由不同探测器组独立发起; 基于文件名称来管理: 通过目录名来定义数据产生的主旨,例如wfcta/common/generator/; 分别冠以KA、WD、CD、SD的前缀; 除了RUN号,加入重用(比如多次投点)标记SEQ号; 粒子数据:CDXXXXXX_YYYY.part,XXXXXX:RUN号,YYYY:SEQ号; 大气契仑柯夫光数据:CDXXXXXX_YYYY.cer; 芯位信息:CDXXXXXX_YYYY.txt,包含:irun ievent xcore ycore 最好有基于数据库的逻辑名管理系统,或许DIRAC的BADGER(张晓梅的报 告)能够给出更好的解决方案。

模拟数据样本的整合:探测器(暂定方案) 独立的探测器模拟: 不同探测器独立重建: 事例整合分析: 程序需统一输入接口:包含参数:CDXXXXXX_YYYY.part CDXXXXXX_YYYY.txt [ CDXXXXXX_YYYY.cer ]。 数字化、真实化、加噪处理后的hit信息: CDXXXXXX_YYYY_KA_hit.root; 不同探测器独立重建: 重建信息(不包含hit信息): CDXXXXXX_YYYY_KA_rec.root; 重建时可以加入触发模拟模块,必要时需降低触发要求。 事例整合分析: 针对不同物理目标,以其中一种探测器为主,其它探测器信息辅 助; 输入选项:所需整合的各种探测器的hit、rec数据文件; 数据读入与事例循环处理:需解决事例匹配方式问题; 输出:需定义格式。

LHAASO的触发模式 三种候选方案: 硬件触发:传统方案,采用电子学硬件实现逻辑判选,发送 common stop信号,然后探测器各通道传送电荷、时间等信息; 半硬件触发:探测器信号汇总后通过电子学硬件(如FPGA)实 现逻辑判选; 软触发(无触发):探测器信号汇总后,通过计算集群并行处理 实现复杂逻辑判选。 对数据分析得影响:在硬件或半硬件触发的模式下,不同探测器 数据只能通过coordinated-GPS时间戳来进行离线符合分析。 WFCTA将采用“半硬件触发”模式; 其它探测器将采用“软触发”模式;

软触发的实现 能够实现在线符合! 各个探测器的hit信号(约15000路,除去WFCTA)能够通过WR协议 和平台实现亚纳秒(<0.3 ns,预期达到0.1 ns)的时钟同步; 计算机集群处理多种(3)触发模式,对hit信号整体判选; 可实现探测器hit级粒度相关性; 需求: 触发逻辑的物理设计; 并行处理模式的实现方案和优化; 数据流的同步和分配; 原始数据流的吞吐量: 集群集中管理:自动诊断、自动屏蔽、系统和软件不停机在线更新。 探测器 KM2A WCDA SCDA WFCTA 单路计数率(kHz) 1 (ED), 12 (MD) 50 0.03 10 数据量(Gbps) 3.7 18 0.002 2.4(半硬)

大数据 触发后数据量: 参照对比(数据来自于孙功星的报告): WCDA的12 PB/yr会对数据传输和存储造成严重的问题! 注:WFCTA:1/10的duty cycle。 参照对比(数据来自于孙功星的报告): LHC四个实验总和:12 PB/yr; BESIII:2009->现在:3 PB。 WCDA的12 PB/yr会对数据传输和存储造成严重的问题! 探测器 数据量 (MB/s) 年总量(PB) KM2A 10 0.32 WCDA 380 12 SCDA 5 0.16 WFCTA 30 0.10

数据实时在线处理(WCDA为例) 物理和现实需求 标定: 环境参数监测数据的整合: 重建: 物理分析: 见吴含荣的报告:12 PB/yr  1.2 PB/yr。 标定: 电荷:单路计数信息单光电子峰、子峰、高低量程的重叠; 时间:光纤信号,5-10 Hz的频率出现在触发事例中; 信息的输出(histograms)、保存(database)与拟合; 实时监控。 环境参数监测数据的整合: 水质测量、高压、水温、室温、气压、水位等等; 根据时间信息综合到数据中(以文件为基准); 重建: 标定与环境监测数据的读取; 事例的分发与整合。 物理分析: 对已知源的实时监测与分析结果的互联网发布(如同SWIFT,FERMI-LAT 等); 对瞬变源的全天扫描分析。

离线快速处理(WCDA为例) 部分数据快速离线处理的必要性: 机遇窗口:<3天。 数据需求典型值:约10天数据的1/50。 根据强源的细致分析来对探测器的整体性能进行监测; 本实验在线分析发现新源后对结果的细致分析和结果及时发布(如: ATel)和发表; 对其它波段实验探测到新源的及时跟进分析和结果发布。 机遇窗口:<3天。 数据需求典型值:约10天数据的1/50。 瓶颈:主要在于数据读取,CPU也可能成为问题。 数据可索引,随机读取,快速事例遍历与过滤。比如,根据 root原理,合理设计tree的建构方式。 数据分流(或HADOOP的tag?孙功星的报告): goodness(事例好坏); degree of sense(物理意义); reduced output(精简输出); zone(分区,比如赤纬)。

算法革新 软触发的算法: 簇射前锋面的拟合(相当于track): 噪声过滤: 粒子鉴别(指原初粒子): 能量重建: hits到达时间的无序(比如<1 ms)、吞吐量巨大(~25 Gbps)。 簇射前锋面的拟合(相当于track): 发展更先进的算法,更高精度,同时高速、高效。 噪声过滤: 如WCDA:50 kHz3600,WFCTA(单台):10 kHz1024 ; 需要特殊的filter算法,压制噪声,提高重建效率。 粒子鉴别(指原初粒子): 多参数分析:簇射信号分布形态、多探测器复合信息。 能量重建: 能量分辨差(>30%),主要来自于空气簇射本身的涨落; 寻找更好的能量重建机制和方法:芯位、横分布速度; 特殊信号的处理,比如muon、噪声的考虑。

总结 特色: 进展: 问题: 欢迎富有经验的粒子物理界的专家和同行参与 LHAASO实验计算软件与技术的发展工作! 多种探测器相对独立、粒度相关性、高噪声、软触发、大 数据、在线数据处理、数据快速访问; 具备一定的先进性和开创性,同时也具有非常大挑战性。 进展: 尚处于起步阶段,介入容易,可以融入更多的先进理念; 问题: 基础弱,缺乏人力、经费等支持力度。 欢迎富有经验的粒子物理界的专家和同行参与 LHAASO实验计算软件与技术的发展工作!