LHAASO合作组会议,2017,威海 LHAASO作业调度及 存储系统 中科院高能物理研究所计算中心 李海波 2017.9 威海.

Slides:



Advertisements
Similar presentations
联想 LeoStor 分布式存储系统 李秀峰 解决方案产品经理 联想大客户企业级产品营销 Mail :
Advertisements

高级服务器设计和实现 1 —— 基础与进阶 余锋
云时代的存储技术创新.
北海市 城市总体规划(修编) (2001—2020).
LSF系统介绍 张焕杰 中国科学技术大学网络信息中心
中部科學工業園區台中園區擴建 用地(原大肚山彈藥分庫)開發計畫
对存储系统发挥特殊作用的文件系统 2006年5月 - 北京.
计算中心2002年总结.
HADOOP的高能物理分析平台 孙功星 高能物理研究所/计算中心
三星—SCH-W999 建议零售价格:9380 元 上市时间:2011年12月
UROVO—i6200 外观设计 建议零售价格:XX元 上市时间:2014年 月 12 日 目标人群:快递、物流、医院、零售、快销
企业级云计算 A Enterprise Cloud Serivce
国家高技术研究发展计划 香港大学网格节点 Presented by Cho-Li Wang
Cell organized Distributed File Storage
Information & Security System in China China North Eastern Air Traffic Control Bureau (CAAC) Customer Background Subsidiary of General Administration of.
崔涛,高能所云计算组 高能所计算中心 十八届全国科学计算与信息化会议 Openstack培训及操作 崔涛,高能所云计算组 高能所计算中心.
LSF系统介绍 张焕杰 中国科学技术大学网络信息中心
GlusterFS培训 中科院高能物理研究所计算中心 李海波
李亚康,齐法制,洪剑书,计算中心同事 中国科学院高能物理研究所 中国散裂中子源 2017/6/5,成都
Windows 8 more simple more powerful more free.
SVN的基本概念 柳峰
第二讲 搭建Java Web开发环境 主讲人:孙娜
GETAC—PS336-G1-T 外观设计 建议零售价格:13,830元 上市时间:2014年 2月1日 目标人群:户外现场作业人员
R in Enterprise Environment 企业环境中的R
从现在做起 彻底改变你自己 Sanjay Mirchandani EMC公司高级副总裁、首席信息官.
存储系统.
高能物理云计算应用 中国科学院高能物理研究所 计算中心 程耀东 2016年6月6日.
大学计算机基础 典型案例之一 构建FPT服务器.
高能物理云平台中的弹性计算资源管理 中国科学院高能物理研究所计算中心 程振京 sce2017 Weihai,
SVN服务器的搭建(Windows) 柳峰
Jul 2014 HEAT部署Hadoop集群
基于OpenStack的散裂中子源计算环境概述 —CSNS私有云环境现状
高能所数据存储系统现状与规划 李海波 中科院高能所计算中心 2017/6/5 成都.
第11章:一些著名开源软件介绍 第12章:服务安装和配置 本章教学目标: 了解当前一些应用最广泛的开源软件项目 搭建一个网站服务器
大数据管理技术 --NoSQL数据库 HBase 陈 辉 大数据分析技术.
基于SDN架构的高能物理数据传输虚拟专用网络研究与建设 For HEP Data
Windows网络操作系统管理 ——Windows Server 2008 R2.
Windows网络操作系统管理 ——Windows Server 2008 R2.
森锐科技-SR235 外观设计 建议零售价格:2300元 上市时间:2016年 05 月 01 日
数据挖掘工具性能比较.
厂商—型号 海尔-PAD002 外观设计 建议零售价格:2999元 上市时间:2011年3月 目标人群:有移动互联需求的商务人士
ENS 10.1安装配置指南 王俊涛 | SE.
三星—SCH-P739 建议零售价格:3980元 上市时间:2011年12月
作业调度系统常用命令.
DevDays ’99 The aim of this mission is knowledge..
MUON束流物理实验 袁野
第十八届全国科学计算与信息化会议 虚拟计算中的虚拟机调度与控制研究 崔涛、程耀东 2017年07月05日.
高能物理计算环境概述(IHEP) 中科院高能物理所计算中心 姜晓巍.
李亚康,齐法制,洪剑书,计算中心同事 中国科学院高能物理研究所 中国散裂中子源 2017/7/5,威海
Unit 11.Operating System 11.1 What’s OS 11.2 Related Courses
新一代安全网上银行 小组成员:杨志明 王晶 任毅 刘建中 关昊 刘超.
BESIII Dcache存储 设计与实现 闫晓飞 高能物理研究所 计算中心 2013年7月4日 2019/4/8.
内容摘要 ■ 课程概述 ■ 教学安排 ■ 什么是操作系统? ■ 为什么学习操作系统? ■ 如何学习操作系统? ■ 操作系统实例
微机系统的组成.
HUAWEI—S7-301c 外观设计 建议零售价格:2899元 上市时间:2012年5 月15日
产品介绍 TOPOLF-T198 产品类型:4G MIFI 建议零售价格:699元 上市时间: 2015年1月 目标人群:差旅人士
Cassandra应用及高性能客户端 董亚军 来自Newegg-NESC.
计算机网络与网页制作 Chapter 07:Dreamweaver CS5入门
解决“最后1公里”问题.
网格计算 计算中心 张晓梅 伍文静.
Thomson-252G 外观设计 上市时间:2011年1月 目标人群:普通消者,行业用户费 标准配置:一电一充\耳机\数据线\DC充电器
南大天文系的 计算环境 黄永锋 南京大学天文系
Touch Github = Touch the World
28th Weekly Operation Report on DIRAC Distributed Computing
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
Google的云计算 分布式锁服务Chubby.
云计算在高能物理实验 分布式计算的结合应用
進行員工胸部X光 主講人:黃宜玟感控師 林新醫院
3.8 局域网应用实例 某省劳动和社会保障网络中心组网实例 会议中心的无线组网实例.
FVX1100介绍 法视特(上海)图像科技有限公司 施 俊.
Presentation transcript:

LHAASO合作组会议,2017,威海 LHAASO作业调度及 存储系统 中科院高能物理研究所计算中心 李海波 2017.9 威海

提纲 (一)计算系统 (二)存储系统 (三)下一步计划 (四)小结 LHAASO合作组会议,2017,威海

(一)LHAASO计算系统 计算中心计算环境概况 LHAASO计算环境 LHAASO作业情况 资源共享策略 作业前端工具

计算中心计算环境概述 本地集群 ~11000 CPU cores 主要为串行作业,即单核作业 过去10年,使用PBS管理作业和资源 2016年末,将所有资源迁移至HTCondor LHAASO合作组会议,2017,威海

计算中心计算环境架构 ON-line farm Login Servers Disk Servers CNIC 10Gbps 10Gb Ethernet (computing. & Storage Network) 10GE IHEP Campus Network CNIC 10Gbps 1Gbps Disk Servers CPU servers ON-line farm FC TPservers Login Servers Home Dirs(AFS) +Monitoring +Scheduler Tape Lib. LHAASO合作组会议,2017,威海

计算环境--资源迁移 PBSHTCondor JUNO start CMS test ~2500 2014.12 2015.2 2015.12 2016.8 2016.12 start test JUNO CMS ~2500 LHAASO DYB HXMT BES ~8000 ALL ~10500 Test and know functions and performance Develop user interface, monitor and management system Implement share policy and optimize performance LHAASO合作组会议,2017,威海

LHAASO计算环境 计算架构 5个调度服务器 18个登录节点 计算节点 1个PBS调度服务器 2个HTCondor调度服务器 2个(成都) 16+5个(高能所) 计算节点 63个(原网格节点,设备濒临淘汰) 虚拟节点 1048个 成都节点:32个 LHAASO合作组会议,2017,威海

IHEPCloud (CERNCloud,EC2, Aliyun,…) 虚拟计算集群 按需分配资源,提高资源利用率 实现资源整合,共享不同实验/组织的计算资源 满足峰值需求 VCondor VMquota 分配算法 IHEPCloud (CERNCloud,EC2, Aliyun,…) juno lhaaso 作业排队 虚拟机启停 当前可用资源 申请资源 资源预留 虚拟池状态 LHAASO合作组会议,2017,威海

LHAASO作业统计 总计 lhaaso用户组 lhaasorun用户组 作业数:1160225 作业总时长:2194806.27小时 活跃用户:48 lhaaso用户组 作业数:931876 作业总时长:1895815.73小时 lhaasorun用户组 作业数:228349 作业总时长:298990.54小时 LHAASO合作组会议,2017,威海

LHAASO作业情况 用户名 作业总时长 作业数量 wangzhen 559122.7 127046 lixr 273564.6 226951 dingxh 268794.0 117239 tianzh 247958.1 165516 changxc 237021.6 25704 yqguo 167985.9 9266 licong 105597.5 11728 zhaolt 60025.66 78119 wusha 47762.64 33228 lihuicai 44168.03 10069 lizhe 33176.85 3147 llma 32833.79 23518 biby 18762.64 4235 lasimu 18478.39 45462 yinlq 14364.25 14260 LHAASO合作组会议,2017,威海

资源共享策略 共享分属不同实验的资源 专用资源与共享资源 中央管理系统控制资源共享 LHAASO合作组会议,2017,威海

资源共享策略 未使用共享策略前,资源忙闲不一,利用率一般维持在50%~60% 共享后,资源利用率 保持在90%以上 LHAASO合作组会议,2017,威海

作业前端工具 Hepjob 工具集 简化作业交互 实现调度控制 统一规范集群作业入口,支持多集群,多调度器 hep_sub, hep_q, hep_rm,… LHAASO合作组会议,2017,威海

Hepjob批量提交 批量提交 建议同批作业使用批量提交方式 简化批量提交命令 一次性提交大量作业 消耗更少的提交时间 减少提交失败的概率 建议同批作业使用批量提交方式 简化批量提交命令 提交前确保作业具有存在并可执行 提交方法: $ hep_sub -n 300 job.sh.{ProcId} LHAASO合作组会议,2017,威海

(二)LHAASO存储系统 存储系统概括 /Scratchfs, /workfs存储系统 CVMFS软件库存储系统 EOS数据存储系统

LHAASO存储系统概括 磁带存储系统 磁盘存储 用户目录 软件库共享 Castor /scratchfs,/workfs /ybjgfs:正在迁移到eos /eos 用户目录 AFS 软件库共享 AFS,CVMFS LHAASO合作组会议,2017,威海

磁盘存储-/scratchfs,/workfs 总空间362TB 用户临时文件,缺省配置5GB,文件数532480000,两周以上不被访问的文件将被自动删除 /workfs 总空间 13TB 用户个人文件,缺省配额5GB,文件数50000 LHAASO合作组会议,2017,威海

公共软件库-CVMFS CERNVM-FS是由CERN开发的一种缓存文件系统,相对于AFS有许多优点 CVMFS替代AFS存储公共软件库 Fuse模式 & 只读文件系统 客户端本地磁盘缓存 适合远程站点,加载公共软件 HTTP协议传输 支持IPV6 CVMFS替代AFS存储公共软件库 2017年初上线使用 目前存放JUNO实验软件 LHAASO合作组会议,2017,威海

EOS存储系统 CERN于2010年开发的磁盘文件系统 内存元数据服务器,支持纠删码、磁盘组等多种新型存储技术 目前已成为CERN主要的实验数据存储系统,存储规模达到150PB 美国、俄罗斯、澳大利亚等全球十几个高能物理实验室已部署多个PB级以上的EOS实例 LHAASO合作组会议,2017,威海

EOS与其他分布式文件系统对比 EOS CephFS GlusterFS LustreFS 存储硬件 JBOD 专业磁盘阵列/JBOD Metadata Server 双MDS互相备份,内存存放元数据,不存在单点故障,存在瓶颈 有多个MDS,不存在单点故障和瓶颈 无MDS,动态算法替代,不存在单点故障 双MDS互相备份,不可扩展,存在瓶颈 冗余保护/副本 支持Replica、Archive、RAID6等多副本 N+M 镜像 无 数据可靠性 多副本提供可靠性 镜像提供可靠性 由存储节点上的RAID1或RAID5/6提供可靠性 故障恢复 支持主备模式,数据多副本,自动恢复 节点失效自动迁移数据、重新复制副本 系统自动处理故障 扩展性 元数据服务器不可扩展、存储节点可扩展 元数据服务器、存储节点可扩展 存储节点可扩展 存储节点可扩展,元数据服务器不可扩展 应用场景案例 海量数据分析 CERN大规模使用 云计算环境中的块存储 多媒体应用、互联网 超级计算应用 LHAASO合作组会议,2017,威海

EOS元数据操作性能 CERN的系统监视显示 多线程服务器可达到每秒百万次的stat请求 LHAASO合作组会议,2017,威海

EOS系统建设 2016年2月上线 LHAASO EOS实例 总空间1.34PB 已使用386.58TB,65万目录,3283万文件 实验数据:/eos/lhaaso/expriment, /eos/lhaaso/simulation 总空间1.34PB 已使用386.58TB,65万目录,3283万文件 LHAASO合作组会议,2017,威海

EOS部署现状 系统配置 2台元数据服务器 7台存储数据服务器 实验数据存储 348块存储磁盘 LHAASO合作组会议,2017,威海

(三)下一步计划 跨域数据传输 EOS软件升级 LHAASO合作组会议,2017,威海

跨域数据传输 需求 目标 远程站点缺少存储资源,无法镜像全部数据 远程网络传输延迟大,直接使用文件系统I/O访问基本无法工作 传统方式下数据需要预先存储,很难满足动态集群作业运行 目标 实现远程数据透明访问 支持跨域的数据查询、目录列表 目前已实现文件级别的跨域访问 下一步实现基于事例级别的跨域访问 LHAASO合作组会议,2017,威海

EOS软件升级 当前EOS使用 v0.3.195版本 EOS Citrine 版本 v4.1.27 FUSE访问性能问题 ⇒ 重写EOS FUSE 元数据纵向扩展(scale up) ⇒ 横向扩展(Scale out) EOS Citrine 版本 v4.1.27 优化元数据存储方式为内存数据库KV持久化存储(QuarkDB) 提供新的元数据服务器HA 优化FUSE LHAASO合作组会议,2017,威海

(四)小结 LHAASO计算目前以HTCondor调度系统为主,计算资源采用虚拟机方式,灵活可扩展,但计算资源较紧张 LHAASO存储采用EOS,满足实验需求 跨域计算与数据访问,拓展新的计算资源 EOS将不断完善,提供高效稳定存储支持 LHAASO合作组会议,2017,威海

谢谢! LHAASO合作组会议,2017,威海