云计算在高能物理实验 分布式计算的结合应用

Slides:



Advertisements
Similar presentations
定 格 入 格 破 格 —— 新诗仿写复习训练 仿照下列句子,再把 “ 人生 ” 比喻成 “ 大海 ”“ 天空 ” , 造两个句子。 如果说人生是一首优美的乐曲,那么痛苦则 是其中一个不可或缺的音符。 参考答案: 1 、如果说人生是一望无际的大海,那么挫折则 是其中一个骤然翻起的浪花。 2 、如果说人生是一片湛蓝的天空,那么失意则.
Advertisements

第七节 心 悸 郑祖平. 一、概述 心悸是一种自觉心脏跳动的不适感或心 慌感。当心率加快时感到心脏跳动不适, 心率缓慢时则感到搏动有力。心悸时,心 率可快、可慢,也可有心律失常,心率和 心律正常者亦可有心悸。 一般认为与心肌收缩力心搏量的变化及 患者的精神状态注意力是否集中等多种因 素有关。
台北縣私立多芮咪托兒所 家 長 手 冊. 序言 親愛的家長 : 關心寶貝與學前教育的過程,是您我共同的 責任;為寶貝創造更美好的明天,是我們共同 的心願。歡迎您的寶貝來本園就讀,並感謝您 對我們的信任與支持。為了使您更了解本園所 的一切,我們特別寫這篇家長手冊,以便您隨 時可以參考,並與學校配合,了解學校的教學.
1/67 美和科技大學 美和科技大學 社會工作系 社會工作系. 2/67 社工系基礎學程規劃 ( 四技 ) 一上一下二上二下三上 校訂必修校訂必修 英文 I 中文閱讀與寫作 I 計算機概論 I 體育 服務與學習教育 I 英文 II 中文閱讀與寫作 II 計算機概論 II 體育 服務與學習教育 II.
国家税务总局关于修改企业所得税年度纳税申报表( A 类, 2014 年版) 部分申报表的公告(国家税务总局公告 2016 年第 3 号) 一、对《企业基础信息表》( A )及填报说明修改如下: (一) “107 从事国家非限制和禁止行业 ” 修改为 “107 从事国家限制或禁止行业 ”
2014 年 12 月 企业所得税年度纳税申报表 (A 类, 2014 版 ) 辅导材料(二) A 企业基础信息 A 主表.
佛教陳榮根紀念學校 姜曉霞老師、吳麗媚老師 元朗區小學教師發展日 二年級喜閱寫意校本整合 寫作教學.
失竊的童年 主講人 : 洪嘉宏 社工員 國立中正大學社會福利學研究所畢業 勵馨基金會 目睹暴力兒童暨青少年方案負責人.
第二篇 建筑空间构成及组合 一 建筑平面设计的内容 从组成平面各部分的使用性质来分析,建筑物 由使用部分和交通联系部分组成。 使用部分是指各类建筑物中的主要使用房间和辅助 使用房间。 交通联系部分是建筑物中各房间之间、楼层之 间和室内与室外之间联系的空间。 建筑平面设计包括单个房间平面设计和平面组 合设计。
CEPC 摄影准直测量预研进展 一、测量模型研究:根据加速器设备布局范围大、控制点间距 大、单相机视场宽度不够的特点,我们研究设计了四相机测量模 型如下:
聖若翰天主教小學 聖若翰天主教小學歡迎各位家長蒞臨 自行分配中一學位家長會 自行分配中一學位家長會.
認識食品標示 東吳大學衛生保健組製作.
信息系统安全等级保护工作 主要内容和工作要求
SARS今冬可能捲土重來 流感與SARS流行期重疊 每年約10%人口(200萬)受感染
王同学的苦恼﹗ MC 4.1 诚可贵﹗.
第八章 互换的运用.
颞下颌关节常见病.
「健康飲食在校園」運動 2008小學校長高峰會 講題:健康飲食政策個案分享 講者:啟基學校-莫鳳儀校長 日期:二零零八年五月六日(星期二)
致理科技大學保險金融管理系 實習月開幕暨頒獎典禮
脊柱损伤固定搬运术 无锡市急救中心 林长春.
职业生涯规划与择业求职 雅虎口碑高级分析师 杨玲 2008年10月31日.
2013年二手车市场环境分析.
Physics and Electronic Science Department
做好就业与自主创业的准备.
結腸直腸腫瘤的認知.
經歷復活的愛 約翰福音廿一1-23.
郭詩韻老師 (浸信會呂明才小學音樂科科主任)
畜禽屠宰厂(场)的设置.
第二章 项目一:企业厂区与车间平面设计 1.
电气与信息工程学院 学科建设情况汇报
计算中心2002年总结.
104學年度高一新生成長營 教務處工作報告 ~~做自己學習的主人~~
国外市场(亚马逊).
物业经理/部门主管 如何有效执行日常管理工作.
房地产企业(项目)银行融资 授信工作指引 2007年版.
公務員廉政倫理規範與案例介紹 報告人:法務部 廉政署 防貪組 社會參與科 科長 陳敏森 2017/3/19 1.
務要火熱服事主.
HADOOP的高能物理分析平台 孙功星 高能物理研究所/计算中心
第8章 机床操作 主讲:臧红彬 博士.
作业现场违章分析.
蒙福夫妻相处之道 经文:弗5:21-33.
2. 戰後的經濟重建與復興 A. 經濟重建的步驟與措施 1.
好好學習 標點符號 (一) 保良局朱正賢小學上午校.
2014創新創業教育研習營 本梯次限額50名,以報名順序額滿為止!! 課程內容及時間:
學生:蔡耀峻、許裕邦 座號:23號、21號 指導老師:黃耿凌 老師
4. 聯合國在解決國際衝突中扮演的角色 C. 聯合國解決國際衝突的個案研究.
6.5滑坡 一、概述 1.什么是滑坡? 是斜坡的土体或岩体在重力作用下失去原有的稳定状态,沿着斜坡内某些滑动面(滑动带)作整体向下滑动的现象。
新陸書局股份有限公司 發行 第十九章 稅捐稽徵法 稅務法規-理論與應用 楊葉承、宋秀玲編著 稅捐稽徵程序.
民法第四章:權利主體 法人 楊智傑.
李亚康,齐法制,洪剑书,计算中心同事 中国科学院高能物理研究所 中国散裂中子源 2017/6/5,成都
Zhihui Sun CC, IHEP 基于perfSONAR的高能物理网络性能监测平台研究与实现 Zhihui Sun CC, IHEP /12/2.
基于SDN架构的高能物理数据传输虚拟专用网络研究与建设 For HEP Data
四年級 中 文 科.
MUON束流物理实验 袁野
第二章 商业银行资本管理.
聖本篤堂 主日三分鐘 天主教教理重温 (94) (此簡報由聖本篤堂培育組製作).
第五章 三角比 二倍角与半角的正弦、余弦和正切 正弦定理、余弦定理和解斜三角形.
K/3 Cloud V6.0产品培训 -- 业务监控 K/3 Cloud 产品部
聖誕禮物 歌羅西書 2:6-7.
亚马逊云计算AWS (Amazon Web Service)
K/3 Cloud V6.1产品培训 -- 业务监控 K/3 Cloud 产品部
网格计算 计算中心 张晓梅 伍文静.
陳重佑 Ph.D. 國立臺灣體育學院體育學系(所)助理教授
中国农业科学院博士后学术论坛 博士后基金申请的经验及体会 中国农业科学院生物技术研究所 秦 华 博士
28th Weekly Operation Report on DIRAC Distributed Computing
依撒意亞先知書 第一依撒意亞 公元前 740 – 700 (1 – 39 章) 天主是宇宙主宰,揀選以民立約,可惜他們犯罪遭
百艳图.
基督是更美的祭物 希伯來書 9:1-10:18.
陳逸飛作品欣賞    已故油畫大師陳逸飛早年成名作品《黃河頌》昨日( )在北京拍賣。在多番競逐下,以破紀錄的4032萬元人民幣天價成交。這不僅是陳逸飛油畫作品的最高價,也創下內地油畫作品成交價的最高紀錄。這幅油畫描述一名紅軍站在黃河旁的山嶺,眺望天際。此畫被視為文革後中國美術史重要作品,1996年在香港以128.5萬港元售出,在11年之間,升值超過30倍。
經文 : 創世紀一章1~2,26~28 創世紀二章7,三章6~9 主講 : 周淑慧牧師
Presentation transcript:

云计算在高能物理实验 分布式计算的结合应用 赵祥虎 中科院高能所计算中心 分布式计算组

提要 高能物理实验分布式计算 云计算资源与分布式计算的集成 商业云 (AWS) 计算资源应用尝试 总结

高能物理实验分布式计算

高能物理实验 高能物理实验通过各种加速器、对撞机、探 测器获取微观世界的基本粒子之间的相互作 用数据。通过对这些数据的分析,探索新的 物理规律 欧洲核子物理研究中心(CERN)的 LHC 上 的四个实验:CMS, ATLAS, LHCb, ALICE 中科院高能所的实验:BESIII, JUNO, CEPC- SPPC,LHAASO,DAYABAY,YBJ

基于 DIRAC 的分布式计算系统 DIRAC (Distributed Infrastructure with Remote Agent Control) 最早由 LHCb 实验开发使用,后来成为独立的项目 通用开源的分布式计算框架 包含完整的作业管理和存储管理功能 整合不同站点的计算和存储资源 多实验 (VO) 支持 应用范围广泛 高能物理实验: LHCb, ILC, Belle II, BES III 天体物理实验: CTA, Glast, Fermi-LAT, LSST 其它: 生物医学、地球科学等等 系统特性 SOA 架构,优秀的扩展性和灵活性 Pilot job 拉作业模式

高能所分布式计算系统 高能所作为中心站点 远程站点 支持多个实验 (BESIII, CEPC, JUNO) 中心服务管理作业调度 中心数据存储 远程站点 合作单位提供计算及存储资源 接收中心作业调度任务 运行 MC 模拟、重建、分析 可以连接多种资源类型 集群资源(PBS, Condor,…),网格资源,志愿 者计算资源,云资源 支持多个实验 (BESIII, CEPC, JUNO) 用户可配置属于某个实验 站点可选择支持特定实验

云计算与分布式计算的集成

云计算与分布式计算 云计算可提供灵活的计算环境 将云计算集成到现有的分布式计算系统中 高能物理实验对操作系统、软件环境要求严格 对资源管理更为灵活 计算任务以事例为单位 事例之间通常没有关联 方便分布式并行处理 将云计算集成到现有的分布式计算系统中 统一作业调度管理 做到对用户完全透明

VMDIRAC 作为 DIRAC 扩展,最早应用于 Belle 实验 用于支持计算作业在云站点虚拟机上的运行 功能 特性 虚拟机管理 虚拟机调度 准备作业运行与软件环境 虚拟机状态监控 (作业状态,数据传输,操作系统状态) 特性 支持同时管理多个云站点 支持多种云管理器类型 OpenStack, OpenNebula, AWS 等 用户透明,对于用户只相当于增加新的站点

虚拟机和作业调度 调度过程 虚拟机调度策略 DIRAC 负责作业管理和调度 VMDIRAC 负责虚拟机管理调度 对作业需要资源量和虚拟机提供的资源量进行匹配 获取虚拟机及作业信息反馈给中心服务器 虚拟机调度策略 elastic 根据作业匹配情况启动和关闭虚拟机,最有效的利用计 算资源 static 根据作业队列启动一批虚拟机,一直运行,需手动关闭 类似于静态集群站点,能够更快响应作业调度,无作业 时存在资源浪费

虚拟机运算环境配置 虚拟机启动过程通过 cloud-init 进行定制 VMDIRAC 中 cloud-init 作用 对于不同云管理系统都有很好的支持 镜像中只需预安装好 cloud-init 默认配置可完美支持 OpenStack, AWS EC2 user-data OpenNebula 需要指定云管理器类型 (data source) VMDIRAC 中 cloud-init 作用 主要用于安装配置 DIRAC Job Agent 以及虚拟机监控模块 授予访问 DIRAC 服务的权限 配置软件运行环境 (CVMFS, 软件运行库, …)

云站点运行状态 已经加入来自世界各地多个合作机构的云计算资源 开放给物理用户使用 多试验支持 (BESIII, CEPC, JUNO) 站点 云类型 CLOUD.IHEP-OPENSTACK.cn OpenStack IHEP CLOUD.IHEP-OPENNEBULA.cn OpenNebula CLOUD.TORINO.it INFN CLOUD.INFN-PADOVANA.it CLOUD.JINR.ru JINR CLOUD.CNIC.cn CNIC 2014/12 ~ 2015/8 云站点运行状态

商业云 (AWS) 计算应用

为什么使用商业云 计算资源需求出现突然上涨 本地集群计算资源缺乏弹性 CERN 对 AWS 进行了大量研究和 测试 大型会议之前 国际竞争的实验要尽快分析出结果 本地集群计算资源缺乏弹性 新资源的购买部署需要数月时间 CERN 对 AWS 进行了大量研究和 测试 选用 AWS 进行商业云的尝试 主要使用 EC2 弹性计算服务

AWS 测试结果 测试使用 AWS EC2 计算资源,数据 保存回高能所存储系统 通过多批作业测试,AWS 成功集成 测试 BESIII 模拟、重建、分析作业 大约完成 600 个作业,总共生成 10 GB 数据传回高能所 很高的作业运行成功率 计算效率和数据传输速率稳定可靠 按时间作业运行数目 不同批次作业运行数目

AWS 性能测试及实例类型选择 对于 BESIII 实验作业,不同实例类型性能对比 c3 实例相对更适合于高能物理实验计算 更高的计算效率 更低的单位计算量价格 计算效率与本地集群计算资源相当 本地服务器 CPU E5-2630 v3 模拟 (s/事例) 重建 (s/事例) 分析 (s/事例) 总 CPU 使用率 t2.micro 4.08 1.61 0.0357 86.5% m3.medium 1.03 0.32 0.0073 95.7% c3.large 0.64 0.21 0.0044 95.6% 本地服务器 0.40 0.13 0.0028 99.5%

AWS 账单分析 开启账单报告,获取更精确地账单信息 以一次运行在 c3.large 上的测试为例,运行大约 4 个小时 EC2 实例计算所占用的账单比例最大 以 BESIII MC 模拟重建分析作业为例,1000 rhopi 事例所需要的总价格约 为 0.20 RMB 账单 (CNY) 百分比 Data Transfer 1.60 2 % EC2 c3.large Instance 73.60 92 % EBS I/O Requests 2.40 3 % EBS Storage 其它 -

商业云优势与展望 商业云优势 展望 商业云的稳定性有很好的保障 极大的可用计算资源量 减轻站点维护的压力 可以作为分布式计算资源的有效补充 竞价实例 可以使用更低的价格获得计算资源 需要调整虚拟机和作业调度策略,物理软件也要进行相应调整 存储 目前没有使用商业云存储 价格较高,安全性需更完整考虑

总结 云计算资源已经提供给物理用户使用 AWS 商业云资源也成功集成到高能所分布式计算系统并 对其计价做了详细分析 云计算已经集成到高能所分布式计算系统,目前运行 稳定 云计算资源已经提供给物理用户使用 AWS 商业云资源也成功集成到高能所分布式计算系统并 对其计价做了详细分析 未来需要完善统一云计算管理、监控、调度

谢谢!