联想DSS并行存储 张莫穷, 联想HPC团队 zhangmq3@lenovo.com.

Slides:



Advertisements
Similar presentations
Web Role 的每台虚机运行有 IIS ,用于处理 Web 请求 Worker Role 用于运行后台进程 Cloud Service 是什么? 支持多层架构的应用容器 由多个 Windows 虚拟机集群构成 集群有两种类型: Web 和 Worker Cloud Service 做什么 进行应用的自动化部署.
Advertisements

WCI361 Windows Vista WCI361 Windows Vista 运行性能设计与 改进.
Information Resource Management
存储基础知识 V1.1.
网络资源 (1)Oracle中国网址: (2)Oracle中国用户讨论组
联想证券极速交易解决方案 联想金融行业 王永超 高贵君.
联想ThinkCLoud LIM 智能统一监控解决方案
顏協邦 慧盟資訊 商業智慧導入服務部 資深經理
Database Architecture, not only DBA
Please delete this page before you present to customer
思科Oracle RAC解决方案 Starry Wu UCS -GC.
对存储系统发挥特殊作用的文件系统 2006年5月 - 北京.
PB级科研数据集的管理和应用 曙光信息产业(北京)有限公司.
加快数据中心运转速度 — 加速业务发展 约翰•福勒 甲骨文公司系统事业部执行副总裁. 加快数据中心运转速度 — 加速业务发展 约翰•福勒 甲骨文公司系统事业部执行副总裁.
陕西凝远绿色建材实业有限责任公司网络系统工程
台灣地理環境與自然災害 小琉球島嶼 組別:第八組 班級:四容四B 組員:黃如翊 D 蔡瑞玹 D
第8章 系統架構.
闪存的时代 - 重新定义企业级存储的经济学 王文惠 高级存储系统顾问.
宝德 ---智能IT基础架构 宝德科技集团股份有限公司 解决方案部.
HADOOP的高能物理分析平台 孙功星 高能物理研究所/计算中心
SA120/SAS112/NAS产品介绍 2013 LENOVO INTERNAL. All rights reserved.
思科统一计算 Cisco思科 UCS.
一年16班 黃佳弘 硬 碟 機 Hard Disk Driver.
                            Oracle 并行服务器介绍
大数据在医疗行业的应用.
第6章 数媒资产管理系统的存储技术 刘士军 1、光纤通道
YARN & MapReduce 2.0 Boyu Diao
EMC VMware架构下的备份解决方案 中国解决方案中心.
2006年10月 面向数据处理的高端系统 胡雷钧 浪潮公司.
Benjamin Armstrong 高级项目经理 微软
讲座5 目标、范围管理与需求工程.
Alibaba 数据库高可用架构 Alibaba
溪洲資訊業務分享 預算、管理、技術.
NEC Express5800 Fault Tolerant Server Introduction
GlusterFS培训 中科院高能物理研究所计算中心 李海波
BTS3911E 一体化站点解决方案 支持UL平滑演进,降低CAPEX 小站点,大容量,提升用户体验 高集成度 ,降低部署成本
沈 彤 英特尔中国区嵌入式产品事业部 市场经理 Jul, 26th 2011
ThinkServer RD540/RD640 新品品鉴
李亚康,齐法制,洪剑书,计算中心同事 中国科学院高能物理研究所 中国散裂中子源 2017/6/5,成都
淘宝核心系统数据库组 余锋 利用新硬件提升数据库性能 淘宝核心系统数据库组 余锋
不断变迁的闪存行业形势 Memory has changed, especially serial - from a low cost, low pin count, slow memory to an advanced, high performance memory solution to save.
从UNIX到Windows的 电信软件移植实践
第十章 基于立体视觉的深度估计.
SOLUTIONACCELERATORS Windows Vista Hardware Assessment 1
Smarter Storage – 價值主張及實戰案例 Dennis Dai Storage Technical Consultant.
Flash数据管理 Zhou da
Isilon中国区技术经理 杨峰 虚拟天文台年会 存储技术交流 Isilon中国区技术经理 杨峰 Isilon Proprietary and Confidential.
Pure Storage設備 雲端桌面系統 評估測試與經驗分享
Ch 9: Input/Output System 输入/输出系统
信息存储与管理 国家天文台 (科技处)信息与计算中心.
遠東NAS-ON 6000教育訓練 簡報 工程師: 傅國忠.
Proware Technology Corp.
LSI 引领服务器进入SAS时代 陆 峰 LSI存储元器件客户经理.
An Introduction to Cloud RDBMS
第4章(1) 空间数据库 —数据库理论基础 北京建筑工程学院 王文宇.
Exchange 2007 系統部署 -- 儲存預測與測試
Low Cost Materials for High Energy Sodium-ion Battery
中国科学院计算机网络信息中心 中国科技网网络中心 All rights reserved
高性能计算与天文技术联合实验室 智能与计算学部 天津大学
中国科学技术大学计算机系 陈香兰 2013Fall 第七讲 存储器管理 中国科学技术大学计算机系 陈香兰 2013Fall.
虚 拟 仪 器 virtual instrument
可愛的鍬形蟲 五年四班2.
百万亿次超级计算机诞生记 姓名 Xiangyu Ye 职务 微软中国技术中心资深HPC顾问 公司 微软中国
中国区部分高性能计算行业用户名单 中石油北京勘探开发 研究院 中海油南方基地 中石化物探研究院 中石油东方物探(BGP) 中科院数学所
MGT 213 System Management Server的昨天,今天和明天
第11章 儲存裝置 與其管理.
Requirements for SPN Information Modeling
Experimental Analysis of Distributed Graph Systems
WiFi is a powerful sensing medium
ppt宝藏提供 中国银行业信息化系统建设研讨会
Presentation transcript:

联想DSS并行存储 张莫穷, 联想HPC团队 zhangmq3@lenovo.com

RAID和磁盘管理功能迁移到I/O服务器 DSS/GSS并行存储系统 SAN存储方案 o l 磁盘扩展柜 File Server 1 File Server 2 客户端 RAID和磁盘管理功能迁移到I/O服务器 GPFS Native RAID GSS存储方案 o l 磁盘阵列控制器 磁盘扩展柜 File Server 1 x3650 File Server 2 客户端 I/O服务器 * Just a bunch of disks i.e. an array of hard drives

Lenovo GSS并行存储 GSS26 (28U) GSS24 (20U) GSS22 (12U) Lenovo GSS with NL-SAS GSS v2.5.9 支持8TB 单盘;GPFS 4.1.1版本 两台 x3650m5 服务器 SAS 12Gb/s连接磁盘JBODs HPC 网络接入: 10Gb / 40Gb / FDR EDR interoperability since GSS v2.5.8 两台, 四台 or 六台 JBODs (4U60) 硬盘支持 3,4,6,8 TB NL-SAS硬盘 可用空间0.5 / 1.0 / 1.6 PB (6TB, 8+2p) 可用空间0.7 / 1.4 / 2.1 PB (8TB, 8+2p) 以“building blocks”方式扩展 容量,性能同时获得提升 GSS26 (28U) GSS24 (20U) GSS22 (12U)

GSS28 (44U) would be 5.2 PB usable (10TB, 8+2P) Lenovo DSS Model G2x0 DSS-G发布时间 : 1Q CY2017 支持Lenovo D3284 JBODs (5U84盘位) 支持Lenovo D1224 JBODs (2U24盘位) 两台x3650-m5服务器 SAS 磁盘连接(12Gbps) HPC高速网络支持:Eth, IB, OPA 1到6个D3284 JBODs (5U84, 12Gbps) 支持4,6,8,10 TB NL-SAS disks 高达3.9 PB可用容量 (10TB, 8+2p) Scale-out横向扩展: 增加building blocks 纵向扩展: 做多6盘箱 For capacitiy calculations: Use 2 disks of spare capacity per enclosure (same as current 4U60), so 82 drives usable Use 2x SSD in encl1, and populate those slots in the remaining enclosures (no holes as in 4U60) Use 8+2P for a fair comparison with competitors (8/10=80% space efficiency); GSS can also use 8+3P which is only 8/11=73% space efficient. GSS28 (44U) would be 5.2 PB usable (10TB, 8+2P) DSS G210 (9U) DSS G260 (34U)

3 1-fault-tolerant mirrored groups (RAID1) De-clustering - a key feature of IBM System x GPFS Storage Server 21 stripes (42 strips) 7 stripes per group (2 strips per stripe) 49 strips 3 1-fault-tolerant mirrored groups (RAID1) 3 groups 6 disks spare disk 7 spare strips 7 disks

Rebuild overhead reduced by 3.5x De-clustering can reduce data rebuild overhead by ~ 4-6 times failed disk failed disk Rd Wr time Rebuild activity confined to just a few disks – slow rebuild, disrupts user programs Rd-Wr time Rebuild activity spread across many disks, less disruption to user programs Large number of stripes completely contained on small number of disks. Rebuild activity confined to just a few disks – slow rebuild, disrupts user programs Rebuild activity spread across many disks, faster rebuild or less disruption (nominally 3%) Rebuild overhead reduced by 3.5x

De-clustered RAID6 enables higher data availability when disks fail parity and spare 14 physical disks / 3 traditional RAID6 arrays / 2 spares 14 physical disks / 1 declustered RAID6 array / 2 spares Decluster data, parity and spare 14 physical disks / 3 traditional RAID6 arrays / 2 spares 14 physical disks / 1 declustered RAID6 array / 2 spares failed disks failed disks failed disks Number of faults per stripe Red Green Blue 2 1 Number of stripes with 2 faults = 1 Number of stripes with 2 faults = 7 This slide shows a graphic that talks about de-clustered RAID6 enables higher data availability when disks fail.

Critical Rebuild Test with 8+3P and 3 disk failures Percentage of critical stripes on 8+3P after 3 disk failures in a 58-disk array: (11/58)*(10/57)*(9/56)=0.5% (4TB ~ 24h  20GB ~ 8min)

Second Phase Deployment GSS v3.1: Enclosure Expansion (Scaling “Up”) Alternative view without animation. Initial Deployment: GSS22 - Storage Enclosures 2 x 200 GB SSD, 116 x 10TB, 12 Gb/s, NL-SAS Raw Capacity = 1160 TB Usable Capacity < 880 TB - Streaming Performance Write < 10 GB/s Read < 14 GB/s Comment: The GSS22 is not intended for scaling out; as a best practice, it would be best to expand to a GSS24 or GSS26 before scaling out. Storage Enclosure 1.2 58 x NL-SAS Storage Enclosure 1.1 58 x NL-SAS + 2 x SSD GSS Server 1.2 GSS Server 1.1 2xEDR 1xGbE Storage Enclosure 1.3 58 x NL-SAS Storage Enclosure 1.2 GSS Server 1.2 GSS Server 1.1 2xEDR 1xGbE Storage Enclosure 1.1 58 x NL-SAS + 2 x SSD Storage Enclosure 1.4 Storage Enclosure 1.6 58 x NL-SAS Storage Enclosure 1.5 Storage Enclosure 1.4 Storage Enclosure 1.3 Storage Enclosure 1.2 Storage Enclosure 1.1 58 x NL-SAS + 2 x SSD GSS Server 1.2 GSS Server 1.1 2xEDR 1xGbE 42 41 40 39 38 37 36 35 34 33 32 31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 Initial Deployment Second Phase Deployment Final Deployment Second Phase Deployment: GSS24 - Storage Enclosures 2 x 200 GB SSD, 232 x 10TB, 12 Gb/s, NL-SAS Raw Capacity = 2320 TB Usable Capacity < 1761 TB - Streaming Performance Write < 20 GB/s Read < 27 GB/s Final Deployment: GSS26 - Storage Enclosures 2 x 200 GB SSD, 348 x 10TB, 12 Gb/s, NL-SAS Raw Capacity = 3480 TB Usable Capacity < 2653 TB - Streaming Performance Write < 23 GB/s Read < 35 GB/s Comment: This feature also applies to SSD Models (GSS21s → GSS22s → GSS24s ) and 10K SAS Models (GSS22s → GSS24s → GSS26s) 2016 Lenovo Internal. All rights reserved.

DSS 概览 Model Reads Writes DSS-G 240 31 24 DSS-G 260 34 20 DSS G202 x3650M5 HPIO D3284 164 x NL-SAS DSS G220 x3650M5 HPIO D3284 334 x NL-SAS DSS G240 x3650M5 HPIO D3284 502 x NL-SAS DSS G260 x3650M5 HPIO D3284 670 x NL-SAS DSS G280 SSD / SAS Option for High Performance / IOPS Low Cost of Entry Performance optimized Capacity Optimized D1224 D1224 D1224 D1224 D1224 x3650M5 HPIO D1224 x3650M5 HPIO x3650M5 HPIO x3650M5 HPIO x3650M5 HPIO D1224 D1224 D1224 D1224 D1224 D1224 2017 Lenovo Internal. All rights reserved. HPIO = High Performance I/O

DSS并行存储的整体优势 Declustered RAID 高性能 高速网络支持 数据一致性、可靠性和灵活性保障 软、硬件打包集成 降低重构过程的系统负载 ,重构速度提高4 – 8倍 高性能 x3650 M5 性能远高于存储控制器芯片 数据一致性, 可靠性&灵活性 End-to-end checksum 2 & 3 fault tolerance Application optimized RAID 高速网络互连 Cluster & storage traffic including failover FDR/EDR/OPA100/10GbE/25GbE/40GbE/100GbE Integrated Server & Storage Packaging Improves density & efficiency Software-based Controller Reduces HW overhead & cost . Enables enhanced functionality Declustered RAID 高性能 高速网络支持 数据一致性、可靠性和灵活性保障 软、硬件打包集成 基于软件的控制器 Spectrum Scale RAID 2016 Lenovo Internal. All rights reserved.

DSS存储系统的发展计划 Distributed Storage Solution for IBM Spectrum Scale Defined Solution especially for large capacity, high performance workloads in HPC environments Distributed Storage Solution for SUSE Enterprise Storage Defined Solution especially for interaction with Lenovo scale-out HANA solutions. Distributed Storage Architecture for SUSE Enterprise Storage / Red Hat Ceph Storage Tested architecture as entry point and mid range CEPH offering in HPC environments. Distributed Storage Architecture for Intel Lustre EE Tested architecture as entry point and mid range Lustre offering in HPC environments. 2017 Lenovo Internal. All rights reserved.