LHAASO实验数据的整合 - 软件与计算的需求分析 高能物理研究所 姚志国 2013/07/06,威海
内容提要 LHAASO实验的特点 模拟样本的综合 软触发的实现 数据实时在线处理 离线快速分析 算法革新
传统宇宙线实验计算机软件的特点 软件规模小: 不受重视: 研发工具简陋: 但LHAASO必须要颠覆这一传统: 一般<100,000行。 支持力度小; 小作坊式,一般由少数几个物理人员兼做LHAASO的现状。 研发工具简陋: 除corsika、root、geant4外,基本不用其它软件包、数据库 和维护、测试等工具。 但LHAASO必须要颠覆这一传统: 数据量大且复杂; 依靠国内强大的加速器实验的帮助:借鉴经验并吸取人力。
LHAASO实验的组成 主要包含4种探测器: 探测器间相对独立: KM2A:平方公里阵列,5635个ED,1221个MD。 WCDA:水契仑柯夫阵列,3600个单元。 SCDA:簇芯探测器:452个单元。 WFCTA:广角契仑柯夫望远镜:24台,1024个像素/台。 探测器间相对独立: 探测器单元结构; 阵列布局; 标定系统或方式; 电子学系统; 实验工作承担人员。
探测器的功能不同 探测器 KM2A WCDA SCDA WFCTA 主要探测对象 电子、子 光子、电子、子 高能光子、强子 大气契仑柯夫光 关注的物理过程 簇射横向 簇芯 簇射纵向 主要物理目标 伽玛天文 宇宙线 主要研究对象 河内源 河外源 宇宙线成份 宇宙线能谱 主要工作能区 10-1000 TeV 0.1-50 TeV 0.1-10 PeV 100 TeV-1 EeV
关联程度不同 相对来说: KM2A最受依赖; KM2A、WCDA的依赖性最弱; WFCTA的依赖性最强(因而,整合性最强)。 依赖对象 SCDA WFCTA - 弱 无 强 相对来说: KM2A最受依赖; KM2A、WCDA的依赖性最弱; WFCTA的依赖性最强(因而,整合性最强)。
模拟数据样本的整合:产生器(暂定方案) 统一坐标系 统一空气簇射产生器(部分事例): 基于各个探测器最高需求:尤其WCDA(最低阈能)和WFCTA (需产生大气契仑柯夫光); 簇射本身信息(粒子种类、能量、方向、阈值); 芯位信息:固定位置(比如WFCTA的产生器就已经采样)或在阵 列范围内随机抽取; 针对不同物理目标,由不同探测器组独立发起; 基于文件名称来管理: 通过目录名来定义数据产生的主旨,例如wfcta/common/generator/; 分别冠以KA、WD、CD、SD的前缀; 除了RUN号,加入重用(比如多次投点)标记SEQ号; 粒子数据:CDXXXXXX_YYYY.part,XXXXXX:RUN号,YYYY:SEQ号; 大气契仑柯夫光数据:CDXXXXXX_YYYY.cer; 芯位信息:CDXXXXXX_YYYY.txt,包含:irun ievent xcore ycore 最好有基于数据库的逻辑名管理系统,或许DIRAC的BADGER(张晓梅的报 告)能够给出更好的解决方案。
模拟数据样本的整合:探测器(暂定方案) 独立的探测器模拟: 不同探测器独立重建: 事例整合分析: 程序需统一输入接口:包含参数:CDXXXXXX_YYYY.part CDXXXXXX_YYYY.txt [ CDXXXXXX_YYYY.cer ]。 数字化、真实化、加噪处理后的hit信息: CDXXXXXX_YYYY_KA_hit.root; 不同探测器独立重建: 重建信息(不包含hit信息): CDXXXXXX_YYYY_KA_rec.root; 重建时可以加入触发模拟模块,必要时需降低触发要求。 事例整合分析: 针对不同物理目标,以其中一种探测器为主,其它探测器信息辅 助; 输入选项:所需整合的各种探测器的hit、rec数据文件; 数据读入与事例循环处理:需解决事例匹配方式问题; 输出:需定义格式。
LHAASO的触发模式 三种候选方案: 硬件触发:传统方案,采用电子学硬件实现逻辑判选,发送 common stop信号,然后探测器各通道传送电荷、时间等信息; 半硬件触发:探测器信号汇总后通过电子学硬件(如FPGA)实 现逻辑判选; 软触发(无触发):探测器信号汇总后,通过计算集群并行处理 实现复杂逻辑判选。 对数据分析得影响:在硬件或半硬件触发的模式下,不同探测器 数据只能通过coordinated-GPS时间戳来进行离线符合分析。 WFCTA将采用“半硬件触发”模式; 其它探测器将采用“软触发”模式;
软触发的实现 能够实现在线符合! 各个探测器的hit信号(约15000路,除去WFCTA)能够通过WR协议 和平台实现亚纳秒(<0.3 ns,预期达到0.1 ns)的时钟同步; 计算机集群处理多种(3)触发模式,对hit信号整体判选; 可实现探测器hit级粒度相关性; 需求: 触发逻辑的物理设计; 并行处理模式的实现方案和优化; 数据流的同步和分配; 原始数据流的吞吐量: 集群集中管理:自动诊断、自动屏蔽、系统和软件不停机在线更新。 探测器 KM2A WCDA SCDA WFCTA 单路计数率(kHz) 1 (ED), 12 (MD) 50 0.03 10 数据量(Gbps) 3.7 18 0.002 2.4(半硬)
大数据 触发后数据量: 参照对比(数据来自于孙功星的报告): WCDA的12 PB/yr会对数据传输和存储造成严重的问题! 注:WFCTA:1/10的duty cycle。 参照对比(数据来自于孙功星的报告): LHC四个实验总和:12 PB/yr; BESIII:2009->现在:3 PB。 WCDA的12 PB/yr会对数据传输和存储造成严重的问题! 探测器 数据量 (MB/s) 年总量(PB) KM2A 10 0.32 WCDA 380 12 SCDA 5 0.16 WFCTA 30 0.10
数据实时在线处理(WCDA为例) 物理和现实需求 标定: 环境参数监测数据的整合: 重建: 物理分析: 见吴含荣的报告:12 PB/yr 1.2 PB/yr。 标定: 电荷:单路计数信息单光电子峰、子峰、高低量程的重叠; 时间:光纤信号,5-10 Hz的频率出现在触发事例中; 信息的输出(histograms)、保存(database)与拟合; 实时监控。 环境参数监测数据的整合: 水质测量、高压、水温、室温、气压、水位等等; 根据时间信息综合到数据中(以文件为基准); 重建: 标定与环境监测数据的读取; 事例的分发与整合。 物理分析: 对已知源的实时监测与分析结果的互联网发布(如同SWIFT,FERMI-LAT 等); 对瞬变源的全天扫描分析。
离线快速处理(WCDA为例) 部分数据快速离线处理的必要性: 机遇窗口:<3天。 数据需求典型值:约10天数据的1/50。 根据强源的细致分析来对探测器的整体性能进行监测; 本实验在线分析发现新源后对结果的细致分析和结果及时发布(如: ATel)和发表; 对其它波段实验探测到新源的及时跟进分析和结果发布。 机遇窗口:<3天。 数据需求典型值:约10天数据的1/50。 瓶颈:主要在于数据读取,CPU也可能成为问题。 数据可索引,随机读取,快速事例遍历与过滤。比如,根据 root原理,合理设计tree的建构方式。 数据分流(或HADOOP的tag?孙功星的报告): goodness(事例好坏); degree of sense(物理意义); reduced output(精简输出); zone(分区,比如赤纬)。
算法革新 软触发的算法: 簇射前锋面的拟合(相当于track): 噪声过滤: 粒子鉴别(指原初粒子): 能量重建: hits到达时间的无序(比如<1 ms)、吞吐量巨大(~25 Gbps)。 簇射前锋面的拟合(相当于track): 发展更先进的算法,更高精度,同时高速、高效。 噪声过滤: 如WCDA:50 kHz3600,WFCTA(单台):10 kHz1024 ; 需要特殊的filter算法,压制噪声,提高重建效率。 粒子鉴别(指原初粒子): 多参数分析:簇射信号分布形态、多探测器复合信息。 能量重建: 能量分辨差(>30%),主要来自于空气簇射本身的涨落; 寻找更好的能量重建机制和方法:芯位、横分布速度; 特殊信号的处理,比如muon、噪声的考虑。
总结 特色: 进展: 问题: 欢迎富有经验的粒子物理界的专家和同行参与 LHAASO实验计算软件与技术的发展工作! 多种探测器相对独立、粒度相关性、高噪声、软触发、大 数据、在线数据处理、数据快速访问; 具备一定的先进性和开创性,同时也具有非常大挑战性。 进展: 尚处于起步阶段,介入容易,可以融入更多的先进理念; 问题: 基础弱,缺乏人力、经费等支持力度。 欢迎富有经验的粒子物理界的专家和同行参与 LHAASO实验计算软件与技术的发展工作!