大亚湾实验离线数据处理 何苗 中国科学院高能物理研究所 2017年6月6日 中国科学院成都情报文献中心.

Slides:



Advertisements
Similar presentations
云计算辅助教学风云录 黎加厚 上海师范大学教育技术系 2010年8月9日.
Advertisements

Information Resource Management
DATE: 14/10/2009 陳威宇 格網技術組 雲端運算相關應用 (Based on Hadoop)
Big Data Ecosystem – Hadoop Distribution
CHAPTER 9 虛擬記憶體管理 9.2 分頁需求 9.3 寫入時複製 9.4 分頁替換 9.5 欄的配置法則 9.6 輾轉現象
何謂專案管理? 美國專案管理學會 專案管理就是「為達成或超出利害關係人的需求或期望,把種種知識、技能、工具、技術應用在專案活動上,…,其牽涉到相互競爭的範疇,時間、成本、品質,以及利害關係人各種不同需求和期望之間的平衡」
集群作业管理系统简介 报告人:罗正平 导 师:肖炳甲研究员.
大亚湾反应堆中微子实验 曹 俊 中国科学院高能物理所 高能物理年会 2006.
加快数据中心运转速度 — 加速业务发展 约翰•福勒 甲骨文公司系统事业部执行副总裁. 加快数据中心运转速度 — 加速业务发展 约翰•福勒 甲骨文公司系统事业部执行副总裁.
网格 及其应用的一些相关技术 高能所计算中心 于传松
第6章 資料庫管理系統 6-1 關聯式資料庫管理系統 6-2 SQL Server資料庫管理系統
Chapter 4. Logistics Information Management
操作系统结构.
HADOOP的高能物理分析平台 孙功星 高能物理研究所/计算中心
EPS数据库使用介绍.
2014年度活動結果與 2015年度經營計畫 2015年1月30日 感謝各位百忙之中來參加本社舉辦的廠商大會
分布式系统 Distributed Systems 第 2 讲 系统模型
商業智慧與資料倉儲 課程簡介 靜宜大學資管系 楊子青.
大数据在医疗行业的应用.
Chapter 5 電腦元件 目標---- 研讀完本章後,你應該可以: 閱讀有關電腦的廣告以及了解它的專業用語(行話)。
異質計算教學課程內容 「異質計算」種子教師研習營 洪士灝 國立台灣大學資訊工程學系
Web-based cooperation + Data Intelligence for Malaysian SME
PMT 读出ASIC研究进展 严雄波 2/5/2013 核探测与核电子学国家重点实验室2013年会.
王耀聰 陳威宇 國家高速網路與計算中心(NCHC)
Basis基本操作、使用者 管理與權限設定
中国散裂中子源小角谱仪 的实验数据格式与处理算法 报告人:张晟恺 中国科学院高能物理研究所 SCE 年8月18日
Flash数据管理 Zhou da
林韬 高能所计算中心 on behalf of JUNO Offline Group 高能物理计算和软件会议 2017/06/06 成都
第5章 資料倉儲的資料建置.
成本控制模組 蔡文賢 國立中央大學企管系教授 SAP FI Certified Consultant
林韬 高能所计算中心 on behalf of JUNO offline group 第十八届全国科学计算与信息化会议 2017/07 威海
Simulink建模与仿真.
生物芯片技术 刘超 李世燕 谢宏林
ACM DIGITAL LIBRARY Presentation by 鄒怡嬋 Effie Zou
機台監控系統 w w w . P r o M O S . c o m .tw.
刘红岩 清华大学 管理科学与工程系 第17章 事务管理 刘红岩 清华大学 管理科学与工程系
「寬頻匯流網路管理」教材 模組四: 第一章 網路管理架構
大亚湾反应堆中微子实验 离线软件 何苗 中国科学院高能物理研究所
Formal Pivot to both Language and Intelligence in Science
邹佳恒 第十八届全国科学计算与信息化会议 • 威海,
Measurement of the continuum Ruds, Ruds(c)+Ψ(3770) and Rhad values in the range from to GeV 张达华 (for BES Collaboration) Institute of High Energy.
MUON束流物理实验 袁野
成品检查报告 Inspection Report
Sensor Networks: Applications and Services
高性能计算与天文技术联合实验室 智能与计算学部 天津大学
Chap. 16 作業排程 期中報告 指 導 教 授 : 盧淵源 教授 第七組成員 : 陳源裕
Guide to a successful PowerPoint design – simple is best
高正宗 System Consultant Manager
成本控制模組 蔡文賢 國立中央大學企管系特聘教授 SAP FI Certified Consultant
中国科学技术大学计算机系 陈香兰 2013Fall 第七讲 存储器管理 中国科学技术大学计算机系 陈香兰 2013Fall.
虚 拟 仪 器 virtual instrument
Common Qs Regarding Earnings
计算机系统结构(2012年春) ----存储层次: Cache基本概念
Smart grid Name:牟传强.
SoC 與微控制器的發展 朱亞民.
报告人:曾婷轩 实验物理中心数据获取组 2015年08月19日
BiCuts: A fast packet classification algorithm using bit-level cutting
百万亿次超级计算机诞生记 姓名 Xiangyu Ye 职务 微软中国技术中心资深HPC顾问 公司 微软中国
符号 目录 页 绝对寻址和符号寻址… 符号寻址- 概述… 打开符号表 编辑:查找和替换…… 查看:过滤器 … 查看:排序…… 符号表:导出
EventDB: 基于NoSQL的高能物理事例管理
11 Overview Cloud Computing 2012 NTHU. CS Che-Rung Lee
何正斌 博士 國立屏東科技大學工業管理研究所 教授
2017学考复习 信息管理(导引P37).
MGT 213 System Management Server的昨天,今天和明天
ADX series Configuration
Experimental Analysis of Distributed Graph Systems
塞上古城银川 银川市是宁夏回族自治区首府,又称“凤凰城”、“湖城”,在半径50公里范围内有西夏王陵国家风景名胜区、苏峪口国家森林公园、青铜峡国家自然保护区、沙湖“4A”级风景名胜区、金水园旅游风景区,还可见贺兰山、黄河、草原、大漠、戈壁。
BESIII MDC 模拟与调试 袁野 年粒子物理实验计算软件与技术研讨会 威海.
OPTIMA Optical Technology(Shenzhen) Co., Ltd 奥蒂玛光学科技(深圳)有限公司
Presentation transcript:

大亚湾实验离线数据处理 何苗 中国科学院高能物理研究所 2017年6月6日 中国科学院成都情报文献中心

大亚湾反应堆中微子实验 在科技部、基金委、科学院、以及地方政府和中广核的联合支持下,设计和建造了大亚湾实验装置(2012年建成),目标为测量中微子混合角θ13 ,性能国际领先。 中国承担全部土建和一半的探测器,由高能所牵头。 美国承担约一半的探测器,俄、捷、港、台实质性贡献。 3000 米隧道 5 个地下实验厅 8 个 110 吨重的中微子探测器 3 个水切伦科夫探测器(4400 吨纯净水) 3200 m2 阻性板探测器 8000 道电子学读出。 2017-06-06 大亚湾实验离线数据处理

大亚湾实验运行历史 其中一个探测器退出正常运行,专门用于JUNO液闪研究 2017-06-06 大亚湾实验离线数据处理

大亚湾完成的物理研究 发现新的中微子振荡,PRL108, 171803 (2012),QSPIRES 引用1689次 探测器性能、建立分析方法,NIM A685, 78(2012),引用100次 论文 引用 备注 2013 13改进,CPC37, 011001 342 2014 13能谱分析与质量平方差,PRL112, 061801 234 编辑推荐 氢俘获测量13,PRD90, 071101(2014) 41 寻找惰性中微子,PRL113,141802 59 2015 13和质量平方差(8AD),PRL115, 111802 103 2016 反应堆中微子谱, PRL 116, 061801 57 氢俘获测量13的改进,PRD93, 072011 15 亮点 惰性中微子改进,PRL117,151802 13 惰性中微子联合分析,PRL117,151801 14 2017 改进反应堆中微子谱,CPC41, 013002 12 13的改进(4%精度),PRD95, 072006 6 引用次数截至2017年3月 2017-06-06 大亚湾实验离线数据处理

Online data taking monitoring of trigger rate Daya Bay data taking Multiple data streams from each experiment hall (EH) Data taking efficiency Data taking time > 97% Physics data taking time > 95% Typical trigger rate EH1: 1.3kHz EH2: 1.0kHz EH3: 0.6kHz Data volume 320 raw data files per day, 1GB per file, raw data volume 100TB/year EH1 physics run: ~48 hours/run EH2 Pedestal run and electronics diagnosis run EH3 Online data taking monitoring of trigger rate 2017-06-06 大亚湾实验离线数据处理

A global picture of data processing Raw Data Daya Bay onsite IHEP/lxslc5 LBNL/pdsf spade spade spade Onsite data processing/PQM DB scraper Keep-Up Production Online DB DB scraper Onsite DB Offline DB DCS DB DQ strip charts at SJTU Data Quality DB Offline data monitor (ODM) at IHEP/LBNL 2017-06-06 大亚湾实验离线数据处理

Data transfer and storage IHEP, Beijing in 10~15 minutes LBNL, California in 15~20 minutes Daya Bay onsite, in 5 minutes Data transfer monitoring Data storage: Two copied of raw data on disk: one at IHEP, the other at LBNL Four copies of raw data on tape: two at IHEP, two at LBNL Disk at IHEP: 2.0PB (1.4PB used) Daya Bay to IHEP IHEP to LBNL 2017-06-06 大亚湾实验离线数据处理

Offline software (1) Software framework (NuWa): Neutrino at Daya Wan 女娲 Offline software (1) Software framework (NuWa): Neutrino at Daya Wan Adoption of LHCb/ATLAS Gaudi framework provides a fully developed component system for simulation, reconstruction and analysis Bitten-slave based auto building and testing system running on multiple offline servers Extending Gaudi Transient Event Store (TES) to Archive Event Store (AES) for prompt-delayed analysis Keeps data objects in memory across execution cycles. Allows users to look for correlated events in past. Configurable based on TES location. 2017-06-06 大亚湾实验离线数据处理

Offline software (2) A Lightweight Analysis Framework (LAF) 女娲 Offline software (2) A Lightweight Analysis Framework (LAF) Compatible with NuWa data objects with higher I/O performance Flexible data buffer allows to access events backwards and forwards Multiple analysis modules running simultaneously 2017-06-06 大亚湾实验离线数据处理

Database 2017-06-06 大亚湾实验离线数据处理

Calibration and reconstruction Calibration sources Weekly calibration runs: LED, radioactive sources Calibration samples in physics runs: PMT dark noise, spallation neutron (spn) Calibration automation File-by-file track (Rolling gain, spn energy scale, channel quality): automated accumulation of calibration sample and generation of calibration constants Run-by-run track (LED gain, Co60 energy scale): semi-automation to find calibration data and generate calibration constants Calibration constants version control Using the rollback date of DBI: choose the latest calibration constants that were inserted into offline database before the rollback date 2017-06-06 大亚湾实验离线数据处理

Onsite data processing and monitoring Physics Performance Monitoring (PQM): quasi real-time data processing onsite using the offline software Raw data are processed file by file using the Portable Batch System (PBS) 16 dedicated CPU cores and 40 additional cores shared with users Web display Latency: ~40 minutes Example1: Number of blocked triggers in one event vs. run time Example2: Reconstructed energy distribution for all triggers in one AD 2017-06-06 大亚湾实验离线数据处理

Offsite data processing and monitoring A “Keep-up” production (KUP) is running at IHEP and LBNL, using the latest calibration constants and full reconstruction KUP job trigger by data transfer Web display using an Offline Data Monitor (ODM) Occupied computing resource: ~ 30 cores Latency: ~ 3 hours Multifunctional  Daya Bay ODM Example plots on ODM 2017-06-06 大亚湾实验离线数据处理

Physics data production Physics production (PP) uses the validated and frozen calibration constants and reconstruction algorithms. Software version and calibration version are separated. A special production strategy for the first two publications Fix offline software, update calibration constants and extend production on the weekly basis Data volume: ~1.2×raw data up to 2014. 0.6×raw data now. Physics production takes place once per year, 1-2 month processing time for each production. Weekly data production Weekly calibration 2017-06-06 大亚湾实验离线数据处理

Data Management Reconstruction data set P15A ls /dybfs/rec/ P11A/ P12A/ P12B/ P12C/ P12D/ P12E/ P13A/ P14A/ P14B/ P15A/ P15A ls /dybfs/rec/P15A/GoodRun_6ADv1_8ADv3/ EH1/ EH2/ EH3/ ls /dybfs/rec/P15A/GoodRun_6ADv1_8ADv3/EH1 more /dybfs/rec/P15A/GoodRun_6ADv1_8ADv3/EH1/run45290.list 2017-06-06 大亚湾实验离线数据处理

Data quality Good/bad file tagging based on auto check and manual check on data quality Data quality strip chart: history of the detector performance Daily auto check Manual check and comment Antineutrino candidate rate Energy scale stability 2017-06-06 大亚湾实验离线数据处理

总结:大亚湾数据及数据处理特点 多数据流:三个实验大厅独立取数、独立传输与存储、独立重建。 两个离线数据中心站点:①高能所;②伯克利实验室。各自独立存储数据、进行数据重建和分析。 事例时间关联分析:反应堆中微子具有多个信号先后关联的特点,要求软件提供事例缓存。给事例筛选增加难度。 数据积累分析:每次物理分析总是使用过去所有积累的数据。为提高重建及分析效率,原始数据始终在磁盘上。 数据实时监控:在线监控(DQM)、现场离线监控(PQM)、离线站点监控(ODM)三级监控手段保证数据质量及时反馈和控制。 2017-06-06 大亚湾实验离线数据处理