李亚康,齐法制,洪剑书,计算中心同事 中国科学院高能物理研究所 中国散裂中子源 2017/6/5,成都

Slides:



Advertisements
Similar presentations
管理科学与工程类专业 职业规划问题探讨 报告人 : 李增兵 67D103 , FTP : // 管理科学与工程学院.
Advertisements

LOGO 流管系研討室簡報 國立勤益科技大學 電子商務應用研討室 研 討 室 ( M302 ). 研討室教育目標  運用網際網路與企業電子化等技術,將資訊科技導入應用於流通服務產業 ,拓展商務機會,並從而探討人員、科技、組織之間的教學與研究議題。 培育學生生具備:  電子商務、虛擬通路規劃與經營能力.
Information Resource Management
机群性能分析软件 Paramon & Paratune
厦门大学数据库实验室 刘颖杰 2014年11月15日 实习总结报告 厦门大学数据库实验室 刘颖杰 2014年11月15日.
世新大學 校務行政e化進度報告 陳育亮
精品开放课程的 建设与应用 谢幼如 教授 广东省高校教育技术中心 华南师范大学教育信息技术学院
國有土地管理與運用問題之探討 主講人: 廖 蘇 隆 中華民國100年10月17 日.
应用性能管理提升客户体验 龙珠客户案例分享 肖澍 云智慧公司.
研究計畫執行 & 計畫人員管理 注意事項說明 研發處研推組 董家鈞組長.
人力资源管理 human resource management
创新实验 课程说明 计算机学院 孙彤 计算机学院 张明.
Please delete this page before you present to customer
对存储系统发挥特殊作用的文件系统 2006年5月 - 北京.
PB级科研数据集的管理和应用 曙光信息产业(北京)有限公司.
第五章 各类园林绿地的规划设计.
香港普通話研習社科技創意小學 周順強老師.
共产党员致力 新疆油田信息化建设 数据公司信息业务党支部 2013年6月.
預計102年1月1日上線 更名為 計畫助理人員管理系統
<大势至共享文件审计系统> ——国内首款服务器共享文件管理软件,基于B/S架构,只需要服务器安装
国外市场(亚马逊).
Network Storage and System Virtualization Technology
~NAS 新 體驗~ 多功能網路儲存伺服器.
第8章 系統架構.
SA120/SAS112/NAS产品介绍 2013 LENOVO INTERNAL. All rights reserved.
云存储的应用及未来.
Openstack入门
人力资源管理 human resource management
第四章 卫生管理体制与机制 卫生事业管理学 国家卫生和计划生育委员会“十二五”规划教材 全国高等医药教材建设研究会“十二五”规划教材
一 二 三 四 五 六 七 项目建设总体情况 建设工作机制与举措 项目建设进展 建设经费投入与使用 贡献与示范 典型案例
妈妈我爱你 你总说我还不懂事 维护我像一张白纸 你眼中我永远是长不大的孩子 虽然我有好多心事 却已不愿说与你知 我曾任性地排斥你爱我的方式
第6章 数媒资产管理系统的存储技术 刘士军 1、光纤通道
武汉测地所 现场集群环境介绍 TC3600刀片服务器产品 扩展方案讨论.
CDM Project Management Database Development
Cloud Computing for Big Data – Monitoring & Resource Management
联想DSS并行存储 张莫穷, 联想HPC团队
崔涛,高能所云计算组 高能所计算中心 十八届全国科学计算与信息化会议 Openstack培训及操作 崔涛,高能所云计算组 高能所计算中心.
NEC Express5800 Fault Tolerant Server Introduction
SmartCMP 混合云管理方案 毛得辉 CloudChef 联合创始人&售前总监.
GlusterFS培训 中科院高能物理研究所计算中心 李海波
高效能運算服務 (High Performance Computing) 建置之經驗分享
面向高能所信息化系统的高可用数据库服务 王丽 计算中心 中科院高能所 第十八届全国科学计算与信息化会议.
淘宝核心系统数据库组 余锋 利用新硬件提升数据库性能 淘宝核心系统数据库组 余锋
Hadoop平台使用 计算中心
信息存储与管理 国家天文台 (科技处)信息与计算中心.
Cloud Computing(雲端運算) 技術的現況與應用
Isilon中国区技术经理 杨峰 虚拟天文台年会 存储技术交流 Isilon中国区技术经理 杨峰 Isilon Proprietary and Confidential.
信息存储与管理 国家天文台 (科技处)信息与计算中心.
基于OpenStack的散裂中子源计算环境概述 —CSNS私有云环境现状
基于SDN架构的高能物理数据传输虚拟专用网络研究与建设 For HEP Data
High Performance Computing Service in NTUCC
失智症老人:懷舊圖卡系統 指導老師:謝易錚 開發團隊:潘辰、楊雲翔 國立臺灣海洋大學電機工程學系 2018/6/8
作業系統 (Operating System)
淘宝核心系统资深专家 (v0.1) MySQL云平台和Erlang实现 淘宝核心系统资深专家 (v0.1)
第二章 Linux简介 Linux概述 Linux系统的特点 Linux中使用的应用程序 Linux的组成 Linux版本介绍
李亚康,齐法制,洪剑书,计算中心同事 中国科学院高能物理研究所 中国散裂中子源 2017/7/5,威海
Chang Chi-Chung 國立大里高級中學
K/3 Cloud V6.0产品培训 -- 业务监控 K/3 Cloud 产品部
K/3 Cloud V6.1产品培训 -- 业务监控 K/3 Cloud 产品部
資訊基本概念 與 資訊與生涯及資訊的未來發展
关于“十三五”规划的思考 水利部农村饮水安全中心 张汉松 2014年10月 昆明.
百万亿次超级计算机诞生记 姓名 Xiangyu Ye 职务 微软中国技术中心资深HPC顾问 公司 微软中国
保變住開發要點 資料來源:台北市政府都發局.
目 录: 一、网络存储系统的登录 二、网络存储系统的基本使用 三、学生提交作业功能的使用 四、教师开放资源功能的使用.
天文领域云--云平台系统 李长华 王甲卫 2019/5/26 On behalf of Astrocloud Project Team
云计算在高能物理实验 分布式计算的结合应用
雲端運算的技術趨勢與影響 資管四A 謝宗儒 A.
天翼云产品介绍.
天翼云3.0产品介绍 2018/4/24.
天翼云3.0产品介绍及18年规划.
Presentation transcript:

李亚康,齐法制,洪剑书,计算中心同事 中国科学院高能物理研究所 中国散裂中子源 2017/6/5,成都 CSNS计算环境概述 李亚康,齐法制,洪剑书,计算中心同事 中国科学院高能物理研究所 中国散裂中子源 2017/6/5,成都

CSNS简介 中国散裂中子源是国家投入大量资金重点建设的大科学装置,是位于国际前沿的高科技、多学科应用的大型研究平台。 预计2018年3月完成验收,第一期建设3台谱仪,规划建设20台谱仪 基于CSNS的实际计算和存储需求,建设了东莞数据中心

提 纲 资源需求 计算环境现状 研究工作 总结

计算需求 云计算平台 高性能计算平台 20台谱仪 3台谱仪 当前需要的资源量 * 7, 随着用户的增多,资源需求越大 实验用户需要200 核CPU,1T 内存 所内用户需要400核,2TB内存 高性能计算平台 1000核CPU,4TB内存,提供MPI并行计算环境 20台谱仪 当前需要的资源量 * 7, 随着用户的增多,资源需求越大

云平台存储 实验数据存储 数据库集群 数据备份 存储需求 虚拟实例需要10TB(20台谱仪,* 7) SSD快速存储50TB SAS存储200TB/年(20台谱仪,* 7) 实验数据存储 用户元数据 ,千万级条记录 高性能计算集群的统计数据 应用系统(zabbix、slurm、日志等) 数据库集群 磁带库50TB/年(20台谱仪,* 7) 数据备份

提 纲 资源需求 计算环境现状 研究工作 总结

计算环境现状 存储系统 云计算平台 高性能计算平台 数据库集群 公共软件库 运维与监控

存储系统 基于glusterfs构建的分布式存储系统 强大的横向扩展能力,支持数PB存储容量和数千客户端,运维简单 支持NFS, CIFS, HTTP, FTP以及Gluster原生协议,完全与POSIX标准兼容 完全支持openstack后端存储 不同的volume类型(SSD和SAS)

存储系统 SL 7.3, 3.8.10 RAID 5, 双副本 硬件 存储空间 同时支持Linux和Windows客户端 性能测试 2台SSD存储服务器 4台SATA存储服务器 存储空间 10TB SSD,300TB SATA 同时支持Linux和Windows客户端 性能测试 1M,640GB,8 process Read:1GB/sec,Write:500MB/sec

云计算平台 虚拟化环境建设-openstack 虚拟计算资源 568 vCPU, 1387GB vMEM 255个内网地址,32个公网地址 控制节点高可用 使用gluster提供统一存储(包含块存储、实例存储和文件存储) 控制节点和计算节点的松耦合架构,保证虚拟实例的独立性 虚拟计算资源 568 vCPU, 1387GB vMEM 255个内网地址,32个公网地址 10TB的云硬盘

云计算平台 网络架构优化 禁用l3-agent 物理网关代替虚拟网关 统一认证 认证与授权分离 Cloud-init 虚拟机初始化 动态热迁移 基于共享存储 消息中间件 RabbitMQ->ZeroMQ 网络架构优化 实现虚拟机和内网机器无缝互通 消除网络节点转发瓶颈和单点故障 统一认证

云计算平台 CSNS Cloud Portal

云计算平台 Network  Topology Resource Statistics Running Status of vm

高性能计算平台 散裂中子源的计算特征 作业管理与资源调度系统——SLURM 基于MPI的并行计算占大多数 同时支持HPC和HTC 支持GPU计算 作业管理与资源调度系统——SLURM Performance: It can accept 1,000 job submissions per second and fully execute 500 simple jobs per second Fault Tolerant Free and Open Source Scalability Power Management Resizable Jobs ……

高性能计算平台 控制节点冗余 网络 统计信息 数据库集群 用户信息管理 资源(32个节点) 计算能力(linpack) 节点之间通过IB网络进行数据传输 统计信息 数据库集群 用户信息管理 LDAP,支持统一认证 资源(32个节点) 896 Cores,4TB Memory 计算能力(linpack) 29891.7Gflops(理论值34406.4Gflops) 效率:86.87%

数据库集群 需求 MariaDB 分支(5.6.31) 稳定,可扩展,读写分离 实验元数据信息,web应用,HPC计算集群,云计算平台 对MySQL做了较多优化,完全与mysql兼容 支持Innodb和XtraDB等多种存储引擎 Keepalived+mysql双主来实现MySQL-HA 使用SSD存储设备,保证读写的速度 提供只读的slave服务器,保证数据的安全性

公共软件库——CVMFS CernVM File System (CernVM-FS) Stratum0 Stratum1 csns-stratum0 ihep-stratum1

运维与监控 Forman + puppet Ganglia OpenDCIM gitlab ELK Stack Zabbix ganglia Ganglia: HPC

提 纲 资源需求 计算环境现状 研究工作 总结

基于docker的弹性作业系统

基于docker的弹性作业系统 方案1 方案2 LBNL:Shifter Linux Containers for HPC Mesos Zookeeper Marathon Docker

提 纲 资源需求 计算环境现状 研究工作 总结

总结 CSNS用户的资源需求调研工作已经完成; CSNS计算环境作为高能所计算环境的子站点运行(HPC、虚拟化集群/云等)

李亚康,计算中心同事 中国科学院高能物理研究所 中国散裂中子源 2017/6/5,成都 谢 谢! 李亚康,计算中心同事 中国科学院高能物理研究所 中国散裂中子源 2017/6/5,成都