C enter of C omputational C hemistry 并行计算机与并行计算张鑫理论与计算化学国际合作研究中心分子反应动力学国家重点实验室.

Slides:

Advertisements

Similar presentations

1 上一页下一页金蝶 K/3 系统概述主讲 : 李赛娟 2 上一页下一页金蝶 K/3 系统概述管理软件的应用框架 K3 系统配置硬件配置软件配置网络配置基本安全策略.

Advertisements

© 2001 孟静制作版权所有第二章 CPU 管理和进程、线程管理 2.1 CPU 管理概述 2.2 进程管理 2.3 进程模型实例分析 :UNIX 早期版本的 CPU 管理子系统 ( 进程模型 ) 2.4 处理机管理实例分析 (2):linux CPU 管理（进程模型） 2.5 线程模型.

第四冊第九課劉老老曹雪芹.

辅导老师：隋秀峰 2008年10月22日 Lab3：MPI Programming 辅导老师：隋秀峰 2008年10月22日.

温故知新问题一：我国科技发展经过怎样的历程？中华民族在历史上曾创造了辉煌灿烂的文化，世界领先；

第一章多核概述使用多核了吗？摩尔定律——芯片的晶体管数量每一年半左右增长一倍。处理器性能不断提高主要基于两个原因：

并行计算机体系结构东南大学计算机学院任国林

计算机系统结构主讲：任国林

第八章组织文化的整合 ——并购中的文化整合（二）小组成员：浦若蓉、朱谷一、贾彦彦.

第6章计算机网络基础信息技术基础.

赵永华中科院计算机网络信息中心超级计算中心

開南大學資訊管理學系學分學程相關說明.

營利事業所得稅查核準則相關概念介紹南區國稅局新營分局林俊標各位學員大家好：

第十一課紅頭繩兒王鼎鈞.

《愛》張愛玲指導老師：胡翰平國二甲 S 黃宜宣.

技术支持部张新凤( ) 并行机群系统安装、使用和管理技术支持部张新凤( )

陶板屋組員:陳婷劉峻愷趙崇佑陳鵬如.

第六課諫逐客書李　斯.

組員:4A140013張瓊云 4A1I0039石宜芬 4A1I0909許峻綱指導老師：王立杰老師

第11章计算机系统计算机系统概述分类方法、计算机系统性能评测方法 2. 微机系统 3. 他体系结构处理机

學號：997I0010、997I0024 組員：洪韋鈴、王婷婷日期：指導老師：王立杰老師

第6章计算机网络基础.

Windows Server 2003操作系统相关配置

班級:二技幼保三甲學號:1A4I0039 姓名:江庭瑋指導老師:張治遙

大陸產業分析 課程說明會.

数字系统设计及VHDL实践专题五专用集成电路设计中的并行算法主讲人：徐向民单位：电子信息学院.

公司法(六) 股份有限公司 1.

乌克兰国立技术大学云技术的发展（科研和教育方面）

计算机网络技术基础 Computer network technology 精品资源共享课程建设组.

“服务器服务于Internet”报告会倪光南 1999年7月6日

网络地址转换（NAT）及其实现.

指導老師：陳韻如班級：幼保二甲姓名：林靜宜學號：4A0I0033

第一章引论 1.1操作系统的概念计算机系统：计算机硬件计算机软件计算机硬件：运算器、控制器、存储器、输入设备和输出设备

95年度... 油品行銷事業部五股供油中心桃園煉油廠~汐止市內溝溪管線詳細路徑示意圖紅藍綠三色線條為管線路徑 TS 2017/9/13

第八課始得西山宴遊記柳宗元.

網路基本概念本章主要是為讀者建立有關網路的基本知識, 作為後續章節的基礎。首先我們會說明網路的基本概念, 接著介紹網路的各種類型與相關的作業系統, 最後則是介紹 OSI 與 DoD 等兩種網路模型, 讓讀者能進一步了解網路運作的方式。

MPI并行程序设计简介曙光信息产业（北京）有限公司 2018年11月.

物流信息技术 Logistics Information Technology

高效能運算服務（High Performance Computing）建置之經驗分享

并行计算实验上机国家高性能计算中心（合肥）.

并行算法实践.

Cuda 平行運算機制報告者：林威辰.

周立旸 IBM中国有限公司网格与虚拟化解决方案

第4章作業系統的介紹及操作.

分散式資料庫管理系統與主從式系統資料庫系統設計實務與管理,5e

MPI并行编程　　　　　报告人：李俊照.

第1章 Fortran概述作为一门诞生于上个世纪50年代后半期的高级计算机语言，Fortran在这个C/C++、Java等新兴语言大行其道的时代仍然活跃在人们的视野之中。Fortran语言的长项在于数值计算，在科学研究和工程设计领域有着广泛的用途。在描述数学语言的自然性方面，Fortran同现存的其他高级语言相比有着明显的优势。对于科研工作者和工程技术人员而言，Fortran语言的易学性和易用性是公认的。

ICA3PP 2000 Hong Kong December

曙光信息产业（北京）有限公司技术支持中心戴荣 2007年12月

基于MPI的并行程序设计王振海西北工业大学理学院西北工业大学高性能计算研究与发展中心 2018/11/28.

作業系統家庭和小型企業網路– 第二章.

曙光集群简明使用手册技术支持中心.

Chapter 4 多執行緒 (Multi Thread)

胡維平國立中正大學化學暨生物化學系 Aug. 30, 2017

High Performance Computing Service in NTUCC

计算机系统结构第一章基本概念第二章指令系统第三章存储系统第四章输入输出系统** 第五章标量处理机第六章向量处理机

并行计算简介高性能事业部：曹振南年4月.

第二章 Linux简介 Linux概述 Linux系统的特点 Linux中使用的应用程序 Linux的组成 Linux版本介绍

十二、并行程序设计基础.

資訊訪視資訊小組製作資訊小組製作.

虚拟现实与增强现实技术概论计算机中心.

胡維平國立中正大學化學暨生物化學系 Aug. 22, 2018

高级操作系统 Advanced Operating System

第八章 SIMD计算机.

中央债券综合业务系统客户端系统介绍内容一、系统简介二、结算功能介绍三、操作说明.

中国科学技术大学计算机科学与技术系国家高性能计算中心(合肥) 2004年12月

主要内容：活动目录的基本知识活动目录的安装构造域帐户安全策略的设置设置共享文件夹安装网络打印机

基于机群结构的高性能服务器技术清华大学计算机系高性能技术研究所 2000年7月1日.

售后培训系列之V9系统中心安装 SecManage 网安事业部广州售后-王长绪.

第四冊第十二課詞選虞美人──李煜水調歌頭──蘇軾醉花陰──李清照.

Presentation transcript:

C enter of C omputational C hemistry 并行计算机与并行计算张鑫理论与计算化学国际合作研究中心分子反应动力学国家重点实验室

C enter of C omputational C hemistry 情况介绍分子反应动力学国家重点实验室交叉分子束动力学课题组理论与计算化学国际合作中心研究员 2 人，其中一位为中国科学院院士，高级访问学者 1 人，博士后研究人员 6 人，博士研究生 18 人，硕士研究生 4 人与多个国际学术团队有很好的合作，与纽约大学化学系张增辉教授合作建立理论与计算化学国际合作研究中心

C enter of C omputational C hemistry 主要研究工作实验方面：交叉分子束对光解，碰撞反应，立体化学动力学的研究激光诱导荧光方法对光解，立体化学动力学的研究飞秒激光对超快动力学过程的研究理论方面：准经典轨线方法对反应动态学的研究量子力学方法对反应动态学的研究复杂体系势能面的构造，拟和量子化学及其他方法对分子结构，物质特性，化学反应过程的研究年，发表文章 84 篇，其中英文 66 篇

C enter of C omputational C hemistry HPC Server

C enter of C omputational C hemistry 并行计算机与并行计算 1 为什么要建造并行计算机 2 并行计算机的类型 3 什么是并行计算，并行进程的特性及并行模型的分类 4 工作站集群 (COW) 的基本结构 5 中国科学院十五计划中关于并行计算部分

C enter of C omputational C hemistry 为什么要建造并行计算机

C enter of C omputational C hemistry 什么是超级计算环境超级计算（ Supercomputing ），从技术的意义上说，是为了在问题的求解上具有更快的速度、更高的精度、更大的规模、更好的性能价格比而采用的非主流计算的设施和方式。

C enter of C omputational C hemistry 计算速度的要求  问题 : 科学和工程问题的数值模拟与仿真 – 计算密集 – 数据密集 – 网络密集 – 三种混合  要求 : 在合理的时限内完成计算任务 – 秒级制造业 – 分钟级短时天气预报 ( 当天 ) – 小时级中期天气预报 (3~10 日 ) – 尽可能快长期天气预报 ( 气候 ) – 可计算湍流模拟

C enter of C omputational C hemistry 问题的规模

C enter of C omputational C hemistry 计算机的规模 :TOP10 (2001 年 7 月 )

C enter of C omputational C hemistry IBM Builds World's Fastest Supercomputer to Simulate Nuclear Testing for U.S. Energy Department

C enter of C omputational C hemistry 以动物的食物链为例

C enter of C omputational C hemistry

打破高性能计算的壁垒 2100 单处理器共享存储局域并行机群广域并行机群 GFLOPSGFLOPS

C enter of C omputational C hemistry 并行计算机分类

C enter of C omputational C hemistry Flynn 分类法 SISD （单指令流单数据流）系统 SIMD （单指令流多数据流）系统 MISD （多指令流单数据流）系统 MIMD （多指令流多数据流）系统五种物理机模型 : 实际的机器体系结构 — PVP (Parallel Vector Processor, 并行向量机 ) — SMP (Symmetric Multiprocessor, 对称多处理机 ) — MPP (Massively Parallel Processor, 大规模并行处理机 ) — COW (Cluster of Workstation, 工作站机群 ) — DSM (Distributed Shared Memory, 分布共享存储多处理机 )

C enter of C omputational C hemistry 几种我们常见的并行计算机 CPU … 总线或交叉开关 SM (a) SMP, 物理上单一地址空间 CPU … 定制网络 LM 虚拟分布共享存储 (DSM) (b) DSM, 逻辑上单一地址空间 P/C … 定制 / 标准网络 LM (c) Cluster/COW, 物理 / 逻辑上多地址空间 SMPMPP … WAN LMDSMSM (d) Grid (Cluster of Clusters)

C enter of C omputational C hemistry 什么是并行计算，并行进程的表述及并行模型的分类

C enter of C omputational C hemistry 什么是并行计算进程 1 发送信息进程 2 接收信息传统的串行计算，分为 “ 指令 ” 和 “ 数据 ” 两个部分，并在程序执行时 “ 独立地申请和占有 ” 内存空间，且所有计算均局限于该内存空间。并行计算将进程相对独立的分配于不同的节点上，由各自独立的操作系统调度，享有独立的 CPU 和内存资源（内存可以共享）；进程间相互信息交换通过消息传递；进程 1 进程 2

C enter of C omputational C hemistry 并行算法的表述在并行算法的表述中，所有描述串行算法的语句及进程均可调用，而只是为了表达并行性而引入几条所谓的并行语句当几个算法步要并行执行时，我们可以写作 Do step i to j in parallel step i step i+1 … step j 或者是：当几个处理器同时执行相同的操作时，我们可以写作 for all i parallel do. end for

C enter of C omputational C hemistry 例如 n=2**k 个数的求和输入： n=2**k 个数存入数组 A 中输出： S=sigma(A(i)) begin (1) for i=1 to 4 parallel do B(i)  A(i) end for (2) for h=1 to logn=2 do for i=1 to n/2**h=1 parallel do B(i)  B(2i-1) + B(2i) end for (3) S  B(i) end 把每一个 A(i) 赋给 B(i ) n=4,k=2, 就是 4 个数的加和 h= 1 to 2 h=1 I=1 to 2 (4/2**1) B(1)  B(1)+B(2) B(2)  B(3)+B(4) h=2 I=1 to 1 (4/2**2) B(1)  B(1)+B(2) S  B(1) 若有 2**2=4 个处理器，则在 1(h) 级可能的并行运算数目为 4/2**1=2. 则运算任务分摊给前两个处理器

C enter of C omputational C hemistry 硬件结构抽象模型 ( 自然模型 )  共享存储  共享存储的模型和语言 ( 适于 PVP, SMP, DSM) X3H5, Pthread OpenMP  消息传递的模型和语言 ( 适于 MPP, Cluster, COW) MPI (Fortran, C, Gamess, Vasp) PVM (Fortran, C)  数据并行的模型和语言 ( 适于在 MPP/Cluster 上实现 SPMD 应用 ) Fortran 90 HPF(High Performance Fortran) 并行模型的分类

C enter of C omputational C hemistry 基于程序构造的模型  CSP  Linda （ Fortran, C, Gaussian ）  Global (Molpro ， Columbus) 基于问题描述的模型  GAMMA  UNITY 基于并行计算理论的模型  PRAM  BSP  LogP

C enter of C omputational C hemistry Yale 大学 Nicholas Carriero 和 David Gelernter 于 1986 年基于分散数据结构和共享存储系统的并行计算模型. Linda 模型定义了一个功能强大的逻辑存储器 (TS) 和在其上的一组核心操作 (in, out, read, eval), 它们能够方便地嵌入到不同的语言 ( 如, C, Fortran) 中而构成相应的并行语言 (C-Linda 和 Fortran-Linda 等 ) 该模型同时还支持动态程序设计和两种不同的编程风格 (Master/Slaver 和 Divide-and-Conquer), 为用户开发不同类型的应用程序提供了灵活的手段. Linda 模型

C enter of C omputational C hemistry （进程从 TS 中提取任务或数据进行计算, 并将结果或生成的新任务放入 TS 中. 并行执行的进程之间通过 TS 进行间接的通信和同步. TS 是一个可被多个进程共享的、能同时存放数据和任务的数据箱） TS 共享数据箱进程 2 进程 4 进程 3 进程 1

C enter of C omputational C hemistry Linda 模型的应用－ Linda in Gaussian HF: SP Opt Freq MP2: Sp Opt Freq DFT: SP Opt Freq －可以将串行代码改编为并行代码支持 C 和 Fortran 语言

C enter of C omputational C hemistry MPI 已经成为一种标准，应用越来越广泛。而最流行的 MPI 工具集当属 mpich 〔〕，是目前高效率的超大规模并行计算（ 1000 个处理器）最可信赖的平台。在当前所有的消息传递软件中, 最重要最流行的是 MPI, 它能运行在所有的并行平台上, 包括 SMP 和 PVP. 二者已经在 Windows NT 和 Windows 95 这样的非 Unix 平台上实现. 程序设计语言支持 C, Fortran 和 Java. 在国产的三大并行机系列神威、银河和曙光上都实现了对 MPI 和支持. MPI (Message Passing Interface) MPI 模型目标 : 是提供一个实际可用的、可移植的、高效的和灵活的消息传递接口标准. MPI 以语言独立的形式来定义这个接口库, 并提供了与 C 、 Fortran 和 Java 语言的绑定. 这个定义不包含任何专用于某个特别的制造商、操作系统或硬件的特性. 由于这个原因, MPI 在并行计算界被广泛地接受.

C enter of C omputational C hemistry MPI 并行程序设计平台由标准消息传递函数及相关辅助函数构成，多个进程通过调用这些函数（类似调用子程序），进行通信；一个程序同时启动多份，形成多个独立的进程，在不同的处理机上运行，拥有独立的内存空间，进程间通信通过调用 MPI 函数来实现；每个进程开始执行时，将获得一个唯一的序号（ rank ）。例如启动 P 个进程，序号依次为 0 ， 1 ， … ， P-1 ； MPI 并行进程的实现

C enter of C omputational C hemistry 消息传递是相对于进程间通信方式而言的，与具体并行机存储模式无关，任何支持进程间通信的并行机，均可支持消息传递并行程序设计；几乎有共享和分布存储并行计算环境均支持进程间的消息传递通信；进程 0 发送一个整数给进程 1 ；进程 1 将该数加 1 ，传递给进程 2 ；进程 2 再将该数加 1 ，再传递给进程 3 ；依次类推，最后，进程 N-1 将该数传递给进程 0 ，由进程 1 负责广播该数给所有进程，并打印输出。进程 1 传递信息进程 3 传递信息进程 2 传递信息进程 0 传递信息

C enter of C omputational C hemistry 在商品化的并行机上, MPI 的环境一般是由系统管理人员事先设置好的，用户不需要变动它. 而在用户自已配置的 NOW( 工作站机群 ) 上运行 MPI 程序则需要设置以下配置文件： (1) 由于加载程序到结点上运行需要调用了 Unix 系统的 rsh 命令，所以需要在每个结点上设置.rhosts 文件，以使 rsh 能正确执行； (2) 由于 NOW 环境的异构性，需要在启动时指定运行结点的体系结构；若未指定，是指使用与启动并行程序的结点具有相同体系结构的结点. 在启动并行程序的机器里，具有相同体系结构的几台机器的名字存放在一个名为 $MPICH/util/machines/machines. 的文件中，一台机器的名字占有文件的一行，其中 $MPICH 是一个环境变量，指明 MPICH 软件安装后所在的目录. 并行程序加载运行时是按照文件中机器名字的先后顺序依次加载的. 商业机中的 MPI

C enter of C omputational C hemistry 程序用以下并行 C 编译器 mpcc 来编译 : 执行下列命令将可执行程序 myprog 加载到 n 个节点上 : mpcc myprog.c –o myprog mpirun myprog –np n MPI 进程是重型的单线进程. 它们拥有不同的地址空间. 因此, 一个进程不能直接访问另一个进程地址空间中的变量. 进程间的通信用消息传递来实现. MPI 的编译与运行

C enter of C omputational C hemistry 工作站集群 (COW) 的基本结构

C enter of C omputational C hemistry COW 简介工作站机群（ Cluster of Workstation ）是将一群工作站用某种结构的网络互联起来，充分利用各工作站的资源，统一调度、协调处理，以实现高效并行计算。通信原语库以及并行程序设计环境工具 : MPI 、 PVM 、 linda 互联网络： LAN （ Myricom Myrinet/Gigabite/Ethernet ）节点：高档微机，对称多处理机 SMP 操作系统： Unix 、 Linux 、 NT 、改进和修改的操作系统通信协议： TCP/IP 、特定的协议

C enter of C omputational C hemistry 基本实现原理 1 网络文件系统 NFS(Unix 、 Linux) 、网络驱动器 (Windows) ， MFS(Mosix kernel)... 2 网络信息服务 NIS (Unix 、 Linux) 、 NIS+(Solaris) 、域（ NT ） 3 并行开发环境及编译器 MPI 、 PVM ， Linda, HPF, GNU GCC/G77 … 4 数学库 Free Scalapack... 5 通信软件 Free Myricom GM 6 作业管理 GNU Open PBS 7 系统管理 GNU SCMS 8 监控管理 GNU OSCAR 9 负载均衡 Mosix

C enter of C omputational C hemistry Ø 软件配置：操作系统：每一个节点都装有多用户，多任务的 RH 7.2 linux(2.4.19) 网络文件系统： NFS ， MFS 网络信息系统： NIS 编译器： GNU C, GNU Fortran 77, Absoft F95 F90 F77, PGI F90 F77 C C++ 并行开发环境： LINDA, MPI 负载均衡： Mosix 数据并行语言高性能编译器和运行库： HF77, PGI HPF ， Free Scalapack 计算软件： Parallelized Gaussian 98 A.9 (with Linda support), Gamess, Molpro, 各种自编程序和交流程序 HPC Server

C enter of C omputational C hemistry 中国科学院十五计划中关于并行计算部分

C enter of C omputational C hemistry 中国科学院网络信息中心高性能计算研究室现有计算设备：－ Power Challenge XL 并行对称多处理系统－日立 SR2201 超级计算并行机系统－曙光 2000-II 超级服务器详细配置可以查询：

C enter of C omputational C hemistry 预备引进：－联想 iCluster1800 高性能机群服务器（已由数学研究院引进，正在试运行）－超过 2 万亿次的超级计算机（预计 2004 年 9 月到位）目前正在征求意见，建立用户资料库

C enter of C omputational C hemistry 1. 什么任务适合在超级计算环境内运行？一般来说，计算量极大而使 PC 不能满足要求或者根本不能计算的任务是适合在超级计算环境中运行的。比如，（ 1 ）需要分布式并行处理的科学计算任务，包括：由于对计算资源要求过大而使现在的硬件条件无法满足要求的计算任务，通过将串行源代码改编为并行源代码来进行计算，或者有通行的并行计算程序（商业或非商业）；（ 2 ）虽然可以计算但是时间过长的问题等。 2. 超级计算环境可以提供怎样的支持？现行的超级计算环境是基于 Linux 或 Unix 操作系统的，所以对于商业程序，应该是支持这两种操作系统的；而对于自编的源代码，可以在超级计算机上编译通过产生可执行文件。如果希望把串行的代码改编为并行，可以得到超级计算中心技术人员的帮助。

C enter of C omputational C hemistry 我们所的使用量子化学和化学动力学涉及的相关课题生物分子、药物分子的设计、模拟及结构特性基元化学反应的量子化学研究材料科学和表面科学物理有机化学及催化过程的研究催化反应动力学及其表征量子动力学研究分子的动态过程 PEMFC 内流体流动与传递现象研究流场理论计算及多维物理场耦合计算

C enter of C omputational C hemistry 谢谢！