高能物理实验规模作业管理系统的设计与实现

Slides:



Advertisements
Similar presentations
办公室保健指南. 减少辐射篇 ❤显示器散发出的辐射多数不是来自它的正面,而是侧面和后面。因此,不要 把自己显示器的后面对着同事的后脑或者身体的侧面。 ❤常喝绿茶。茶叶中含有的茶多酚等活性物质,有助吸收放射性物质。 ❤尽量使用液晶显示器。
Advertisements

魏 饴. 处级干部培训班讲座 一、卓越干部的德行素质  常修为政之德、常思贪欲之害、常怀律己之心!  孔老夫子有个观点 “ 为政以德,譬如北辰居其所而众星拱之。 ”  司马光《资治通鉴》 “ 才者,德之资也;德者,才之帅也。 ” “ 德 ” 胜 “ 才 ” 谓之 “ 君子 ” , “ 才 ”
一、真愛密碼 二、尋求真愛 三、有自尊的愛. 。如果雙方對愛情產生 質疑、困惑時,則表示 彼此之間的愛情關係仍 有 待加強或釐清,千萬別 急著為自己的人生大事 下決定。 我是一個 16 歲的未婚媽媽,發現自 己懷孕時,已經五個月大了,我知 道自己沒能力照顧孩子,在驚訝之 於,大人們只好坦然接受,幫我找.
大地遊戲王 課程實錄.
加強水銀體溫計稽查管制及回收 回收作業須知及緊急應變措施
LSF系统介绍 张焕杰 中国科学技术大学网络信息中心
奥田2016年经销商大会传播方案.
第4章 分錄及日記簿 4-1 借貸法則 4-2 日記簿的格式及記錄方法 4-3 分錄的意義及記錄方法 4-4 常見分錄題型分析
做好就业与自主创业的准备.
第十三屆 Step.1 我們的目標 Step.2 我們的角色 Step.4 權利與義務 義務 權利 年繳會費五百元整
速收简历 速收简历移动APP项目 速收简历团队.
财务管理.
Excel VBA视频教程 课程介绍-什么是VBA
植物保护 课程整体设计 汇报 申报省级精品资源共享课建设 植物保护课程组.
综合布线技术与实践教程 第九章:综合布线系统工程网络分析 课程网站:
UI(用户界面)集训班 Illustrator 高级班.
政府扶持资金通览 技术改造篇.
Android快速开发入门 巫文杰、Android工程师 讲师的CSDN博客地址
本科生医保资料的提交.
Kvm异步缺页中断 浙江大学计算机体系结构实验室 徐浩.
LSF系统介绍 张焕杰 中国科学技术大学网络信息中心
Hadoop I/O By ShiChaojie.
SVN的基本概念 柳峰
第二讲 搭建Java Web开发环境 主讲人:孙娜
Chinese Virtual Observatory
R in Enterprise Environment 企业环境中的R
統計圖表的製作.
什么是Android 本讲大纲: 1、平台特性 2、平台架构 3、Android市场 支持网站:
SOA – Experiment 3: Web Services Composition Challenge
SVN服务器的搭建(Windows) 柳峰
Jul 2014 HEAT部署Hadoop集群
第11章:一些著名开源软件介绍 第12章:服务安装和配置 本章教学目标: 了解当前一些应用最广泛的开源软件项目 搭建一个网站服务器
大数据管理技术 --NoSQL数据库 HBase 陈 辉 大数据分析技术.
Visual Studio Team System 简介
DM81X 视频采集处理 ——简单采集显示例程讲解 广州创龙电子科技有限公司
数据挖掘工具性能比较.
PaPaPa项目架构 By:Listen 我在这.
ENS 10.1安装配置指南 王俊涛 | SE.
UI 软件 设计 移动UI设计(三).
Instructions: Language of the Machine
三:基于Eclipse的集成开发环境搭建与使用
Unit 11.Operating System 11.1 What’s OS 11.2 Related Courses
程序设计工具实习 Software Program Tool
SOA – Experiment 2: Query Classification Web Service
新一代安全网上银行 小组成员:杨志明 王晶 任毅 刘建中 关昊 刘超.
内容摘要 ■ 课程概述 ■ 教学安排 ■ 什么是操作系统? ■ 为什么学习操作系统? ■ 如何学习操作系统? ■ 操作系统实例
《结构力学认知实验》(授课形式)的上课时间改为: 5月5日(周二)晚上18:00~19:30和19:30~21:00,
《结构力学认知实验》(授课形式)的上课时间改为: 5月7日(周四)晚上18:30~20:00和20:00~21:30,
简单介绍 用C++实现简单的模板数据结构 ArrayList(数组, 类似std::vector)
第四章 团队音乐会序幕: 团队协作平台的快速创建
VisComposer 2019/4/17.
实验七 安全FTP服务器实验 2019/4/28.
计算机网络与网页制作 Chapter 07:Dreamweaver CS5入门
我爱我家 初一·1班 刘意.
畢業資格審查系統 操作步驟說明.
JSP实用教程 清华大学出版社 第2章 JSP运行环境和开发环境 教学目标 教学重点 教学过程 2019年5月7日.
iSIGHT 基本培训 使用 Excel的栅栏问题
新制退休實務計算說明- 現職人員退休範例說明
2019/5/8 第2章 数据分析软件介绍.
28th Weekly Operation Report on DIRAC Distributed Computing
OpenStack vs CloudStack
106 學年度新生入學說明會 國立臺灣海洋大學 教務處簡介
學士學位畢業論文說明 逢 學 大 甲 土 理 管 地 2009/10/05.
高雄市97年度國民小學閱讀計畫創新教學-教案達人創新教學方案
云计算在高能物理实验 分布式计算的结合应用
赵忠尧奖学金申请报告 颜田 中国科学院高能物理研究所
基于列存储的RDF数据管理 朱敏
Chinese Virtual Observatory
第六讲 酒店客房管理系统(二) 教育部“十二五”职业教育国家规划教材
实验六、COM类型病毒分析实验 实验开发教师: 刘乃琦 谌黔燕.
Presentation transcript:

高能物理实验规模作业管理系统的设计与实现 中国科学院高能物理研究所 高能物理实验规模作业管理系统的设计与实现 索兵 中国科学院高能物理研究所 2015.08.19

主要内容 Content 1.系统介绍 现状、问题 3.重要部分实现 组件,支持 2.分析设计 系统功能,架构 4.工作小结 进度,展望

系统介绍 每个高能物理实验项目都要运行大规模实验作业, 如何提交并管理? 目前途径: 编写简单脚本, 或利用第三方软件. 中国科学院高能物理研究所 系统介绍 Background 每个高能物理实验项目都要运行大规模实验作业, 如何提交并管理? 目前途径: 编写简单脚本, 或利用第三方软件. 问题: 不便于管理和扩展. 方案:开发一个通用性的作业管理系统

系统介绍 名称: 支持多实验多后端的作业提交管理系统(JSUB). 定位: 介于用户和作业处理层之间, 前端系统. 要求: 通用, 易扩展. Background 名称: 支持多实验多后端的作业提交管理系统(JSUB). 定位: 介于用户和作业处理层之间, 前端系统. 要求: 通用, 易扩展. BESIII CEPC JUNO … 用户 JSUB(fronted) 后端作业处理层(backend) JSUB DIRAC Condor PBS …

系统功能 Design UI Job monitoring Data management Job submission split CLI Conf web Job submission Job monitoring Data management split monitoring status dataset generate register reschedule workflow down/up-load task statistics submit query

系统架构 Design CLI Conf Web Core function submit monitor data Plugin Experiment Backend BESIII DIRAC workspace repository JUNO Condor Persistence metadata CEPC PBS

用户接口 原则: 改变少量参数便可实现不同需求(实验类型,步骤,后端类型,拆分类型,运行软件名等). Implementation 原则: 改变少量参数便可实现不同需求(实验类型,步骤,后端类型,拆分类型,运行软件名等). 配置文件方式:YAML标记语言+Python反射机制. 示例: Experiment: Name: cepc JobSteps: - Type: Sim Executable: Mokka Splitter: Type: ByFile EventMaxPerJob: 20 SeedStart: auto InputData: ./stdhep.list Backend: Name: Dirac Site: - CLOUD.IHEP.cn - GRID.JINR.ru

作业提交模块 Implementation Backend Job conf 核心模块 读取作业参数文件 提交运行 splitter 动态加载 subjobs jobFactory confParser 生成的作业文件 Job script jobSteps workflow opts optsParser 数据传入 生成对象 磁盘存储

Step S S Step:表示具体实验步骤(模拟、重建、分析) Implementation Step:表示具体实验步骤(模拟、重建、分析) optionsFile:对实验执行软件的环境配置和传递参数文件,对每个Step需指定optionsFile模板 StepNumList: 记录本次作业的Step号,遍历每个Step获得。 S Step OptionsParser S HAS-A number optionsParser parser() generateOpts() List IS-A StepNumList

OptionsParser 解析options模板+传入有效参数->生成optionsFile Implementation 解析options模板+传入有效参数->生成optionsFile parse(): 解析optionsFile模板,存入对象属性,以便下一步生成optionsFile generateOpts(): 根据模板内容和某个实际子作业的参数,产生有效的optionsFile文件。

Splitter 将作业任务拆分为批量作业集(subjobs), 再分发到计算节点运行. Implementation 将作业任务拆分为批量作业集(subjobs), 再分发到计算节点运行. 拆分方式: ByEvent, ByFiles, ByRun. split(): 分解作业,是生成subjobs的基础. 以往Splitter直接返回作业对象集, 即Splitter和实验”高度耦合”; 本系统Splitter只返回作业参数集, 不用关心是什么实验, 而由jobFactory生成作业对象. Param1 (不完整的subjob1) Param2 Splitter split Param3

jobFactory 生成作业对象. 作业对象可以只用字典{}表示,包含作业所有必要信息. Implementation 生成作业对象. 作业对象可以只用字典{}表示,包含作业所有必要信息. createSubJobs(): 根据实验名,后端平台,拆分器,步骤索引产生子作业对象集. splitter experiment subjob1 createSubjobs() subjob2 jobfactory subjob3 backend stepNumList subjobs

workFlow 控制作业中工作流执行的步骤和流程,根据用户指定而变化. 中国科学院高能物理研究所 workFlow Implementation 控制作业中工作流执行的步骤和流程,根据用户指定而变化. 当前将各种工作流元操作独立出来,形成modules,根据jobSteps动态添加相应的module. workflow module module module module module module module ... ... module step1 step2 ...

支持后端 DIRAC DIRAC Nodes Nodes Nodes JSUB 1 状态:平台部署已久,正常运转中 思路: Implementation 1 DIRAC 状态:平台部署已久,正常运转中 DIRAC Nodes Nodes Nodes JSUB Backend Interface 思路: 1.提供DIRAC接口类,和DIRAC客户端实现对接.. 2.JSUB生成的作业属性和DIRAC定义的作业属性相一致. 3.DIRAC会把作业分发到远端,必要时有上传下载,注册数据的操作(数据管理).

支持后端 Condor JSUB 2 状态:在两台虚拟机上搭建环境以作测试 思路:与DIRAC类似,但要生成Condor格式的作业描述文件. Implementation 2 Condor JSUB Condor Interface 状态:在两台虚拟机上搭建环境以作测试 central manager+ work machine submit machine 思路:与DIRAC类似,但要生成Condor格式的作业描述文件.

支持更多案例以完善功能,同时对框架进一步优化 工作小结 Summary 提交,数据部分实现,监控待开发 支持更多案例以完善功能,同时对框架进一步优化 提供图形化界面 其他

开发环境 Attachment Python2.7 Eclipse3.8 +PyDev JDK1.7 Ubuntu14.04

Thanks for watching~!