实验物理与计算资源 Zhang Shaoqiang March 22, 2004
理论体系和BES实验 基本粒子及相互作用
物理理论 对基本粒子及相互作用的描述 弦理论(String?) 引力理论 大统一理论 广义相对论 超对称(Super Symmetry?) 引力理论 大统一理论 广义相对论 超对称(Super Symmetry?) 电弱理论(EW Theory) 强相互作用理论 量子色动力学(QCD) 电磁相互作用 弱相互作用 量子电动力学(QED) (V-A Theory etc.)
实验物理中心的物理课题 Tau轻子质量的精确测量 J/Psi、Psi’物理 D/Ds物理 R值测量 Psi(3770) ~1777MeV, 精度~0.4MeV J/Psi、Psi’物理 由粲夸克(c)及相应反夸克构成的介子 D/Ds物理 由粲夸克(c)和(u、d、s)轻夸克构成的介子 R值测量 QCD理论检验,Higgs质量的估计等 Psi(3770)
BES探测器及实验方法 北京谱仪的主要探测器 顶点探测器、主漂移室、飞行时间计数器、簇射计数器、磁铁线圈、Muon子计数器、亮度探测器等
北京谱仪上的物理实验 Mento Carlo模拟 离线数据处理 加速器中心提供正负电子束流, 在北京谱仪中心点对撞 BES电子学系统 离线刻度 BES电子学系统 触发系统 在线取数及监测系统 Mento Carlo模拟 软件模拟真实物理过程,包括正负电子对撞、 粒子产生和衰变、在各探测器的响应及在线触发等 产生和真实实验类似的事例 MC RAW DST 物理分析
BES物理实验中的数据 Event size (KB) 1RUN ~30000 Events (MB) J/Psi 2年数据 ~5000 RUN (GB) RAW 原始数据 2 60 300 REC. 重建数据 4 120 600 DST 重建压缩数据 0.6 18 90 MC-RAW MC-REC. MC-DST MC-MCMADE 摸拟信息数据 实际上在磁盘上存储的文件可能是上述一类数据,也可以是二类或三类数据的组合。例如实际的重建数据文件包含 RAW,Mento Carlo DST数据文件包含 MC-MCMADE. 这种组合型数据增加了文件大小,但为利于物理分析这种方式是必要的
其它数据文件包括在线数据库文件、亮度记录文件、各类离线刻度文件等.每类文件大小大约是 DST 数据的1/3-1/20
BESI/II总数据量的估计 900GB×(1+1.5)×2×(1+0.5) ≈ 7TB A = J/Psi2年重建数据 A×(1+K(其它物理课题))×N(重建次数)×(1+O(其它类型数据)) 900GB×(1+1.5)×2×(1+0.5) ≈ 7TB 没有考虑Mento Carlo数据,Mento Carlo产生的事例一般是真实数据事例的1-10倍! 在BESFARM上的3000万J/Psi Mento Carlo数据约120GB (J/Psi真实数据5000万)
BESIII总数据量的估计 7TB×(12/2)×(3000/20) ≈ 6300TB 单个在线事例的记录长度由2K增加到12K(取决于探测器特征),在线触发率由20event/s增加到3000event/s(取决于加速器亮度) 7TB×(12/2)×(3000/20) ≈ 6300TB
CPU和网络速度 BESI/II CPU使用状况 Pentium IV 1.5GHz上重建一个RUN(30000events)约7分钟 IHEPFARM上(11CPU)重建2年J/Psi数据(5000RUN)约一周时间 Mento Carlo 模拟事例产生(Pentium III 1.0GHz) 每秒产生事例(event/s) 产生1RUN(30000事例)的时间(hour) 双Muon事例 12 2/3 Bhabha事例 1 8 Hadron强子事例 2 4 BESIII 对CPU的需求和磁盘需求一样,相对BESII要乘上因子(6×150) ~ 900
BES数据流程 BESIII网络 考虑常数因子 900 在线数据带记录40KB/s 重建写盘速度300KB/s,10Mbits/s网络就能满足需要.对FARM中的服务器若有10个客户端则可配置100M网络 对访问数据频繁的物理分析作业,服务器配置1000M网络是基本要求 BESIII网络 考虑常数因子 900
BES各类作业对计算资源的需求 高 中 低 作业类型 DISK SPACE CPU NETWORK 数据处理 在线磁带预处理 数据重建 压缩、分类 离线刻度 Mento Carlo 物理分析 一般分析 J/Psi、Psi’分波分析 高 中 低
BES PCFARM现状 作业系统用PBS(Portable Batch System)取代了NQS(Network Queuing System) 优势: 增强了作业各项功能,具有灵活的用户开发接口 不足: 缺少单个队列的独立性,用户即使递交作业到空闲队列也要受总作业数的限制.单个队列的权限没有得到认可. 现有PCFARM的规模 一台服务器+(10~20)台节点机,缺乏大型PCFARM管理经验
操作系统和BES软件结构 BESI/II采用的系统和结构 操作系统: VAX/VMS,HP/UX,PC/LINUX,(IBM/AIX,SUN/OS) 软件所用的语言: FORTRAN (支持多平台数据交换,浮点数表示) 外部库: CERN Library, Xlib. PAW, GEANT3 etc. 软件开发和管理: CMS(在VAX上运行),Codeman(网络型) 作业递交: NQS
BESIII系统和结构方案? 操作系统: 以PC/LINUX为主 软件所用的语言: C++ 外部库: CERN Library, Xlib. CLHEP(Class Library for High Energy Physics) ROOT, Anaphe, GEANT4 etc. 数据库: PostgreSQL 软件开发和管理: CVS 作业递交: PBS?
计算中心计算环境和BESIII物理实验 计算中心现有软硬件技术 操作系统: LINUX (REDHAT7.3?) 网络文件系统: AFS 考虑操作系统的稳定性以及和西欧中心物理软件的兼容性 网络文件系统: AFS 增强文件系统的灵活性、提供安全机制 虚拟存储系统: CASTOR、磁带库、磁盘阵列、mySQL数据库 分级存储,适应海量数据存储和处理分析的需要 作业递交和管理: PBS? 灵活配置服务器、节点机和PBS队列,开发合适的用户接口 千兆交换机、光纤设备 合理的硬件连接方案
影响BES计算环境的因素 BESIII数据规模因子(900?) 离线数据处理和物理分析系统 计算中心的计算环境 在线和触发判选系统: 减少电子学噪音、提高好坏事例判断力 加速器亮度: 原则上越高越好 离线数据处理和物理分析系统 C++,面向对象的设计语言.即使采用优化的 Object Oriented 设计方案仍有可能增加CPU的开销 数据结构,直接影响数据量的大小 数据分类方案,对CPU、数据量、网络都有一定影响 计算中心的计算环境 建立和BES在线取数系统的光纤连接通道 根据数据处理和分析流程分类设计PCFARM 以CASTOR为中心的存储管理系统直接影响其它软硬件系统的运作 采用新的硬件技术消除各种瓶颈
另外,计算机行业3~5年内的新技术对最后BES实验的计算环境也有较大影响 参考内容
Block Diagram of BES III Trigger TOF Global Trigger Logic DISC Hit/Seg Count Track Match MDC DISC Track Seg. Finder Track Finder EMC Energy Balance TrigSum TC Sum Etotal Sum L1P Cluster Counting MU DISC Mu track CLOCK RF TTC 3.2 s
MDC trigger simulation Feasibility of trigger scheme study Trigger efficiency study Wire in-efficiency influence study Backgrounds rejecting ability study Production of configuration data Track Segment Finding Track Finding/PTD
BESIII DAQ Scheme
High mass Higgs HZZ l+l– jet jet Need higher Branching fraction (also nn for the highest masses ~ 800 GeV/c2) At the limit of statistics