高效能運算服務 (High Performance Computing) 建置之經驗分享

Slides:



Advertisements
Similar presentations
1 上一页 下一页 金蝶 K/3 系统概述 主讲 : 李赛娟 2 上一页 下一页 金蝶 K/3 系统概述 管理软件的应用框架 K3 系统配置 硬件配置 软件配置 网络配置 基本安全策略.
Advertisements

C enter of C omputational C hemistry 并行计算机与并行计算 张鑫 理论与计算化学国际合作研究中心 分子反应动力学国家重点实验室.
第 3 章操作系统基础 3.1 操作系统概述 3.2 操作系统的功能模块 3.3 典型操作系统概述.
LOGO 流管系研討室簡報 國立勤益科技大學 電子商務應用研討室 研 討 室 ( M302 ). 研討室教育目標  運用網際網路與企業電子化等技術,將資訊科技導入應用於流通服務產業 ,拓展商務機會,並從而探討人員、科技、組織之間的教學與研究議題。 培育學生生具備:  電子商務、虛擬通路規劃與經營能力.
第 2 章 中央處理單元.
多核结构与程序设计 杨全胜 东南大学成贤学院计算机系.
第一章 多核概述 使用多核了吗? 摩尔定律——芯片的晶体管数量每一年半左右增长一倍。 处理器性能不断提高主要基于两个原因:
会场事项 会议日程 无线网络 iocasmeeting 8:30-9:45 MPI并行编程基础 周纯葆 11:30-13:00 午餐时间
机群性能分析软件 Paramon & Paratune
赵永华 中科院计算机网络信息中心 超级计算中心
第1章 计算机基本概念与基础知识.
讓人看了難忘的故事 中藥房轉載 分享人生積極正面訊息 創造宇宙合諧快樂能量.
教育雲端科技的現況與未來發展 臺北市政府教育局聘任督學 韓長澤.
对存储系统发挥特殊作用的文件系统 2006年5月 - 北京.
一种权衡风险收益的推荐方法 北京大学 作者:王卓 主讲人:邱镇.
中国高性能计算机的发展趋势分析与展望 从中国TOP100排行榜谈起
日新月异的信息技术.
加快数据中心运转速度 — 加速业务发展 约翰•福勒 甲骨文公司系统事业部执行副总裁. 加快数据中心运转速度 — 加速业务发展 约翰•福勒 甲骨文公司系统事业部执行副总裁.
操作系统原理 Principles of Operating System
联想RISC to IA —IT基础架构优化解决方案
周 苏 教授 QQ: 系统集成与项目管理 周 苏 教授 QQ:
Abaqus在上海超算中心的应用 朱炜垚 上海超级计算中心.
授 课 人:杨要科 : Q Q : 第2章 操作系统应用基础 授 课 人:杨要科 : Q Q :
“服务器服务于Internet”报告会 倪光南 1999年7月6日
當企鵝龍遇上小飛象 DRBL-Hadoop Jazz Wang Yao-Tsung Wang
報告人:王月杏 行動電話 台南市 九十九年度電腦維運相關事宜 報告人:王月杏 行動電話
99年台南市中小學電腦維運 --招標結果暨配發說明
网 站 设 计 与 建 设 Website design and developments
2006年10月 面向数据处理的高端系统 胡雷钧 浪潮公司.
第6章 電腦軟體 應用軟體 多元程式處理 系統軟體 記憶體配置 作業系統簡介 虛擬記憶體 作業系統的演進與發展 行程管理
3D繪圖軟體 CATIA V5介紹 第十一組 劉子剛.
雲端運算虛擬主機技術的發展.
NEC Express5800 Fault Tolerant Server Introduction
TPC-C标准及实验平台.
異質計算教學課程內容 「異質計算」種子教師研習營 洪士灝 國立台灣大學資訊工程學系
IBM DB2 Personal Edition 試用報告
課程名稱:計算機概論 授課老師:李春雄 博士
Review Question 安裝 or 管理過 Windows Server? 安裝 or 管理過 Unix-like Server?
計算機及資訊網路中心 作業組服務介紹 2006/03/24 系所網管會議 助理程式設計師 張傑生
操作系统课程的特点: 实践性强(从实践总结出原理)
李亚康,齐法制,洪剑书,计算中心同事 中国科学院高能物理研究所 中国散裂中子源 2017/6/5,成都
電腦的種類 超級電腦 (supercomputer) 大型電腦 (Mainframe) 迷你電腦 ( Mini computer)
周立旸 IBM中国有限公司 网格与虚拟化解决方案
指導老師 : 張文智 組員: B 黃美華 B 林耕宇 B 蕭凱中 B 游振偉
張永華 主任 本模板来源于网络,由第一课件网整理发布,免费分享给大家使用。
第1章 Fortran概述 作为一门诞生于上个世纪50年代后半期的高级计算机语言,Fortran在这个C/C++、Java等新兴语言大行其道的时代仍然活跃在人们的视野之中。Fortran语言的长项在于数值计算,在科学研究和工程设计领域有着广泛的用途。在描述数学语言的自然性方面,Fortran同现存的其他高级语言相比有着明显的优势。对于科研工作者和工程技术人员而言,Fortran语言的易学性和易用性是公认的。
GPU分散式演算法設計與單機系統模擬(第二季)
Discover the power of SSL-VPN+ IT management
组长:吴蔚 项目组成员:吴蔚,邱丁兰,汪琳莺
R教學 安裝RStudio 羅琪老師.
第一章 認識Java Java 程式設計入門(I).
曙光集群简明使用手册 技术支持中心.
胡維平 國立中正大學化學暨生物化學系 Aug. 30, 2017
High Performance Computing Service in NTUCC
失智症老人:懷舊圖卡系統 指導老師:謝易錚 開發團隊:潘辰、楊雲翔 國立臺灣海洋大學電機工程學系 2018/6/8
校 園 雲端輸出管理系統 新印科技股份有限公司 聯絡人:伍宏一 電 話: /
疾病预防控制绩效考核管理软件 开发思路 & 使用说明
Operating System Principles 作業系統原理
第3章 認識處理元.
資料結構與C++程式設計進階班 課程大綱 講師:洪安.
雲端虛擬化 Cloud Virtualization
Intel Compiler 安裝.
胡維平 國立中正大學化學暨生物化學系 Aug. 22, 2018
資訊基本概念 與 資訊與生涯及資訊的未來發展
百万亿次超级计算机诞生记 姓名 Xiangyu Ye 职务 微软中国技术中心资深HPC顾问 公司 微软中国
凌群電腦新一代   交易所TCP/IP Gateway
售后培训系列之V9系统中心安装 SecManage 网安事业部 广州售后-王长绪.
中国区部分高性能计算行业用户名单 中石油北京勘探开发 研究院 中海油南方基地 中石化物探研究院 中石油东方物探(BGP) 中科院数学所
程式語言簡介 2019/7/17 明乘中學編製.
2015年度中科院超级计算环境青岛分中心培训 中科院超算中心 中科院海洋所超算中心
Presentation transcript:

高效能運算服務 (High Performance Computing) 建置之經驗分享 2008/02/15 台灣微軟 2008 學術交流研討會 台灣大學 計算機及資訊網路中心 作業管理組 程式設計師 張傑生 jsc@ntu.edu.tw

大綱 歷史回顧 現況說明 推廣瓶頸 規劃考量 改善需求 未來展望 心得交流

歷史回顧 1990~年代 Cray XMP Cray J916 Vector machine So-called supercomputer They were retired several years ago due to Y2K. J916 XMP

現有設備 建置日期:2003/11 運算節點:50 效能 未來計畫移做教育訓練用途 Nexcom Blade Server Dual Intel Xeon 2.0GHz 1GB memory Gigabit ethernet connection 效能 Rpeak: 400 GFlops Rmax: 200 GFlops 未來計畫移做教育訓練用途

現有設備 建置日期:2005/05 運算節點:78 效能: 目前服務主力 適合對象: IBM Blade Server Dual Intel Xeon 3.2GHz 5GB memory Gigabit ethernet connection 效能: Rpeak: 998 GFlops Rmax: 500 GFlops 目前服務主力 適合對象: Serial jobs(非平行化程式) 已透過 MPI 平行化之程式

現有設備 建置日期:2006/11 運算節點: 效能: 目前服務主力 適合對象: IBM p595 64*Power5 1.9GHz CPU 256GB memory AIX 5.3 效能: Rpeak: 486 GFlops Rmax: 421 GFlops 目前服務主力 適合對象: 已透過 OpenMP 平行化之程式 大量記憶體需求之程式

現有設備 建置日期:2006/11 完工日期:2007/05 運算節點:106 效能: 適合對象: HP DL145G3 Server Dual Intel Xeon 3.0GHz 4GB memory Infiniband connection 效能: Rpeak: 4900 GFlops Rmax: 3022 GFlops 適合對象: 已透過 MPI 平行化之程式 需要大量 cpu 數目之程式

2003 Nexcom 刀鋒伺服器 2005 IBM 刀鋒伺服器 2006 HP 機架伺服器 2006 IBM 大型主機 主機種類 Grid Computing Cluster SMP Share Memory Architecture 硬體規格 50 組運算節點 Dual Xeon 2.0GHz CPU 1G mem 78 組運算節點 Dual Xeon 3.2GHz CPU 5G mem 106 組運算節點 Dual Xeon 3.0GHz CPU with Dual Cores 4G mem 單一主機具備 64顆CPU 256GB 記憶體 128 組運算節點 Dual Xeon 3.0GHz CPU with Quad Cores 8G mem 網路連結 Gigabit Ethernet Infiniband N/A 計算效能 200G Flops 500G Flops 3022G Flops 421G Flops 8189G Flops 作業系統 Linux/Debian Linux/Redhat IBM AIX Windows 2003 排程軟體 OpenPBS/Torque LSF/Slurm LoadLevel WCCS/PBSPro 安裝軟體 Open Source Packages Open Source  Packages Intel, PGI compiler Intel Math Kernel Library IBM XLC/Fortran ESSL IMSL 安裝多組 商業套裝軟體 服務對象 Sequential program 與使用少量節點之 MPI 平行程式 需要使用大量節點之 MPI 平行程式 需要使用大量記憶體之 sequential program 以執行套裝軟體為主 備註 由於硬體規格相對老舊,因此以教學與測試用途為主。   預計於 2008/04 上線服務

現況說明 服務對象 服務政策(~2007) 遍及校內 5 學院 1 中心共 18 系所之研究團隊約四十組。 包括:物理系、化學系、凝態中心、土木系、機械系、工科系、農藝系、光電所、電子所、電信所、資工系與藥學系等單位。 服務政策(~2007) 資源分配遵循公平性原則,一視同仁。 以提供基礎設施為主 Hardware/OS/compiler 鼓勵使用者自行採購所需軟體 定期舉辦服務推廣說明會與教育訓練

推廣瓶頸 推廣心得 檢討 侷限於服務「既有」使用者 新使用者拓展速度低於預期 教育訓練 使用者追求短線績效 商業套裝軟體所費不貲 緩不濟急 程式開發能力養成非旦夕之功可及 遑論平行化概念及技巧 使用者追求短線績效 投入人力時間望之卻步 開發程式 既有程式平行化 替代方案 套裝軟體 商業套裝軟體所費不貲 Unix* environment Not able to run windows applications!

使用者群分析 Source code available platform independent sequential program 1. general case 2. large memory requirement parallel program 1. MPI 2. OpenMP Commercial package platform dependent Linux 1. SAS 2. Discovery Studio 3. Material Studio Windows 1. SAS 2. SPSS 3. Matlab 4. Mathematica

2007 Cluster 規劃考量 目標 規劃 建置 開發新使用者,推廣高效能運算服務。 滿足不同族群使用者之需求 採用 Windows Compute Cluster Server(WCCS)2003 Debuted at Dec/2006 提供 Windows based 計算環境 方便使用者執行 windows application 購置少許商業套裝軟體 SAS/SPSS /Matlab/Mathematica 期望有效控制採購版權數目 服務對象 需要長時間執行程式之使用者 建置 廠商提供足夠版權數目之 Linux/Windows 作業系統 未來將視使用狀況調整 128 nodes 之 OS 分配

建置中 建置日期:2007/10 運算節點:128 Infiniband connection 效能: 未來規劃 IBM Blade Server Dual Intel Xeon 2.66GHz with quad cores 8GB memory Infiniband connection 效能: Rpeak: 10895 GFlops Rmax: 8189 GFlops 未來規劃 以執行「套裝軟體」為主

2007 Windows Cluster 環境示意圖

改善需求 WCCS 仍有許多成長空間 軟體本身 技術支援 系統記錄 多元化 job queue 支援 統計報表 微軟公司 軟體廠商 網路社群 執行時間、資源分配、差異化權限 統計報表 技術支援 微軟公司 技術文件、知識庫 軟體廠商 缺乏與 WCCS 整合經驗 多核心、平行版本之計價方式與使用 網路社群 可搜尋文件有限

未來展望 持續推廣高效能運算服務 教育訓練 套裝軟體 善用電腦教室資源 拓展使用者數目 從遙不可及的「高效能運算」轉化成 唾手可得的「普及運算」 教育訓練 利用 visual studio 友善環境及平行化支援 降低除錯難度 提升平行化程式開發能力 套裝軟體 利用 WCCS 架構 提供環境方便使用者執行熟悉軟體 有效控管軟體版權避免浪費 善用電腦教室資源 納入 WCCS 控管 充分利用系統閒置時間

新的驚奇 Windows HPC Server 2008! What is that? What is the future of WCCS 2003?

心得交流 謝謝大家 敬請不吝指教