中国科学技术大学计算机科学与技术系 国家高性能计算中心(合肥) 2004年12月

Slides:



Advertisements
Similar presentations
渡黑水溝 郁永河. 2 戎克船:是明末清初時期往返兩岸的主要交通工具 ∗ 1. 關於台灣的開發歷史,我們到底了解多少呢?不妨試著說出 就我們所知有關台灣開發史的故事、小說、電影、音樂與大 家分享。 ∗ 2. 什麼是黑水溝?黑水溝為什麼會成為大陸移民渡海來臺時最 大的威脅? ∗ 3. 有聽過「六死三留一回頭」、「有唐山公,無唐山嬤」這兩.
Advertisements

台南市立後甲國中 訓導工作簡報 報告人:訓導主任 傅寶源 歡迎蒞臨指導. 訓導處是一個關懷學生生活問題、處理 學生生活事務的溫馨園地,舉凡生活常 規、安全防護、交通安全之教育,民主 法治、社團活動、訓育活動之訓練,衛 生習慣、飲食健康、預防疾病之培養, 體育活動,運動競賽、身心健康之鍛練, 均有專人專責為同學服務。
C enter of C omputational C hemistry 并行计算机与并行计算 张鑫 理论与计算化学国际合作研究中心 分子反应动力学国家重点实验室.
《礼记 · 学记》学习心得报告 教育的本质与运用 主讲人:徐浩明. 一、认识什么是教育 二、明白教育的本质 三、如何落实德行教育.
新約研讀 彼得前書複習 讀經組
中國宗教精神與其哲學.
幼 兒 遊 戲 訪 談 組別:第七組 班級:幼保二甲 姓名:4A0I0008劉俐音 4A0I0043吳碧娟 4A0I0059劉又甄 4A0I0060江佳霓 4A0I0061蕭靖霓 4A0I0079王毓君.
第一章 十六世紀中葉以前的臺灣與原住民 第一節 考古發掘與史前文化.
第五章 主张超尘绝俗的 佛家.
三國演義之赤壁之戰 By 溫雅婷 胡翊軒 王蓉蓉 高渝涵 鄭巧芳.
第三節 亞洲的反殖民化運動 本節學習重點 1.了解中華民國成立後的發展 2.明白日本殖民臺灣與朝鮮的異同 3.學習印度在二十世紀初期的表現
举国上下抗击风雪灾害专刊 温暖行动 灾情告急年关近 万众一心齐抗灾 可歌可泣留千古 温暖行动遍人间 导读提示 阳关雨露出版社
量化vs質性研究分析 量化vs質性研究分析 報告人:王秀民.
台塑石化 與 全國 之 財務分析 :企管二甲、乙 班級 指導 :楊雪蘭 老師 :第六組 組別 組員
作文选刊 作文之窗
唐宋傳奇、筆記小品和史書、論著中的寓言 中碩二 吳佳樺.
兒童期 7 青春期 兩性圓舞曲 乘客:七年級同學 司機:張立杰老師.
第二课 扬起自信的风帆 我能“行”.
天府欧城“星光儿童乐园” ---项目计划书 此为机密文件。 天府欧城.
引導者的角色 組別:第5組 4A1I0003 劉芷媛 4A1I0004 陳安琪 4A1I0014 陳佳瑩 4A1I0046 葉倢茹
快乐假期 2010年第6期 总第54期 贝尔芬 主编 暑期作文专刊 《快乐假期》杂志社 出版.
VS 兒童及少年身心發展 幼保三甲 幼兒期 青少年期 4A1I0014 陳佳瑩 4A1I0023 尤秀惠
增值税转型 2008年12月.
情緒與壓力管理─背部舒緩 指導老師:彭易璟 第六組組員:會資三乙 499A0047 謝宛霖 會資三乙 499A0019 吳汶諭
高考考试说明解读 --政治生活.
第五课 让挫折丰富我们的人生 挫折面前也从容.
星星知我心 談古話今….. ……..觀星望斗 主講人: 陽光青春美少男.
反垃圾掩埋場相關報告 組長:文煊 組員:鄭侃文 李浩暐 胡育睿 李瑞耘 朱祐賢 林承宇.
2013 澎湖自助旅行講座 澎湖,其實就是一片海洋 主辦:沿著菊島旅行 協辦: 台北澎湖同鄉會、台中澎湖同鄉會、高雄澎湖同鄉會
人力资源市场统计工作介绍 人力资源市场与人员调配处 郭俊霞 2014年12月.
老师:如何撰写教研文章? 主讲:石修银 谨以此赠与孜孜追求的老师 谨以此赠与改变人生的老师.
指導老師:楊淑娥 組別:第一組 成員:劉怡萱4a0i0066 吳珮瑜4a0i0070 林秋如4a0i0075 陳婉婷4a0i0076
"性"不"性"由你 性別平等之探討 北屯國小 張文陵.
組員:4A140013張瓊云 4A1I0039石宜芬 4A1I0909許峻綱 指導老師:王立杰老師
依“标”据“本”,命制考题 发表于《数学教学》2006年第9期 (华东师大核心“CN”刊物)
組員: 洪暐翔、 賴峻毅 侯家豪、 賴琦穎 指導老師: 王惠鈴 老師
12星座 对于星座,你又知道多少呢? 第一刊.
第7章 行政监督.
学生培养的过程性评价.
触电预防与急救 杜芳艳.
数学通报简介 ——如何写稿及投稿 数学通报 郑亚利 2014年8月.
数字系统设计及VHDL实践 专题五 专用集成电路 设计中的并行算法 主 讲 人:徐向民 单 位:电子信息学院.
我的心得報告 經過篩選,挑中我們 十多位學生由學校推薦進入公司,開始他們的學習之旅 學習的過程中有想像不到的意外驚喜
推进《玻璃钢制品工》 国家职业资格证书制度的建设
本期导读: 1版 习 惯 2版 的 十个做人的好习惯 3版 力 4版 量 5版 6版 7版 8版
指導老師:陳韻如 班級:幼保二甲 姓名:林靜宜 學號:4A0I0033
個人理財規劃 演講人:鎮明常 教授.
马克思主义基本原理概论 第三章 人类社会及其发展规律.
組員:蔡惠雅 494D0032 楊雅惠494B0079 蔡騏鴻 葉時宇 余建霖495B0002 陳瑛淑495B0021
台中市不動產經紀人職業工會 不動產經紀營業員 複訓班
第5章 编码.
习题解答.
中国科学技术大学计算机科学与技术系 国家高性能计算中心(合肥) 2004年12月
党员干部要争做社会主义 社会公德的表率 党员干部要争做 社会公德的表率 中共河南省委党校 周海涛.
十二、并行程序设计基础.
黄土高原的水土流失 标题 水土流失的原因 水土流失的危害 治理措施 参考文献 小组成员.
陳維魁 博士 儒林圖書公司 第五章 控制結構 陳維魁 博士 儒林圖書公司.
如何讓孩子成為明日之星 芃芃森林幼稚園 許玉芳 園長.
國立豐原高級中學 104學年度家長代表大會 主持人:張健家會長 時間:104年10月3日(星期六)上午10時0分 地點:行政樓二樓會議室.
试乘试驾团购执行方案(模板) 单 位:经销商名称 时 间:
Week 2: 程式設計概念與 演算法的效能評估
浙江大学医学院公共技术平台 实验仪器预约管理系统系列培训 医学院公共技术平台 丁巧灵
中国科学技术大学计算机科学与技术系 国家高性能计算中心(合肥) 2004年12月
第八章 SIMD计算机.
藝術大師-達利.
兒少保護通報處理流程介紹 臺中市家庭暴力及性侵害防治中心 陳秀婷/張美慧 社工督導員 2012/10/19.
2019/8/26 二元一次方程式的圖形 陳玉珮 2019/8/26.
老厝老街老心情……. 一起尋找老街人文的感動 組員:家榕、瑞旂、子寧、琪芬
104學年度第二學期 燈音開課 03/14燈光開課.
教育部國民及學前教育署 新課綱銜接教材數位平台
Presentation transcript:

中国科学技术大学计算机科学与技术系 国家高性能计算中心(合肥) 2004年12月 并 行 计 算 中国科学技术大学计算机科学与技术系 国家高性能计算中心(合肥) 2004年12月

第二篇 并行算法的设计 第四章 并行算法的设计基础 第五章 并行算法的一般设计方法 第六章 并行算法的基本设计技术 第七章 并行算法的一般设计过程

第四章 并行算法的设计基础 4.1 并行算法的基础知识 4.2 并行计算模型 第四章 并行算法的设计基础 4.1 并行算法的基础知识 4.2 并行计算模型

4. 1 并行算法的基础知识 4. 1. 1 并行算法的定义和分类 4. 1. 2 并行算法的表达 4. 1. 3 并行算法的复杂性度量 4 4.1 并行算法的基础知识 4.1.1 并行算法的定义和分类 4.1.2 并行算法的表达 4.1.3 并行算法的复杂性度量 4.1.4 并行算法中的同步和通讯

并行算法的定义和分类 并行算法的定义 并行算法的分类 算法 并行算法:一些可同时执行的诸进程的集合,这些进程互相作用和协调动作从而达到给定问题的求解。 并行算法的分类 数值计算和非数值计算 同步算法和异步算法 分布算法 确定算法和随机算法 国家高性能计算中心(合肥) 2019/4/23

4. 1 并行算法的基础知识 4. 1. 1 并行算法的定义和分类 4. 1. 2 并行算法的表达 4. 1. 3 并行算法的复杂性度量 4 4.1 并行算法的基础知识 4.1.1 并行算法的定义和分类 4.1.2 并行算法的表达 4.1.3 并行算法的复杂性度量 4.1.4 并行算法中的同步和通讯

并行算法的表达 描述语言 并行语句示例 可以使用类Algol、类Pascal等; 在描述语言中引入并行语句。 Par-do语句 for i=1 to n par-do …… end for for all语句 for all Pi, where 0≤i≤k 国家高性能计算中心(合肥) 2019/4/23

4. 1 并行算法的基础知识 4. 1. 1 并行算法的定义和分类 4. 1. 2 并行算法的表达 4. 1. 3 并行算法的复杂性度量 4 4.1 并行算法的基础知识 4.1.1 并行算法的定义和分类 4.1.2 并行算法的表达 4.1.3 并行算法的复杂性度量 4.1.4 并行算法中的同步和通讯

并行算法的复杂性度量 串行算法的复杂性度量 并行算法的几个复杂性度量指标 最坏情况下的复杂度(Worst-CASE Complexity) 期望复杂度(Expected Complexity) 并行算法的几个复杂性度量指标 运行时间t(n):包含计算时间和通讯时间,分别用计算时间步和选路时间步作单位。n为问题实例的输入规模。 处理器数p(n) 并行算法成本c(n): c(n)=t(n)p(n) 总运算量W(n): 并行算法求解问题时所完成的总的操作步数。 国家高性能计算中心(合肥) 2019/4/23

并行算法的复杂性度量 Brent定理 令W(n)是某并行算法A在运行时间T(n)内所执行的运算 量,则A使用p台处理器可在t(n)=O(W(n)/p+T(n))时间 内执行完毕。 W(n)和c(n)密切相关 P=O(W(n)/T(n))时,W(n)和c(n)两者是渐进一致的 对于任意的p,c(n)›W(n) 国家高性能计算中心(合肥) 2019/4/23

4. 1 并行算法的基础知识 4. 1. 1 并行算法的定义和分类 4. 1. 2 并行算法的表达 4. 1. 3 并行算法的复杂性度量 4 4.1 并行算法的基础知识 4.1.1 并行算法的定义和分类 4.1.2 并行算法的表达 4.1.3 并行算法的复杂性度量 4.1.4 并行算法中的同步和通讯

并行算法的同步 同步概念 同步语句示例 同步是在时间上强使各执行进程在某一点必须互相等待; 可用软件、硬件和固件的办法来实现。 算法4.1 共享存储多处理器上求和算法 输入:A=(a0,…,an-1),处理器数p 输出:S=Σai Begin (1)S=0 (2.3) lock(S) (2)for all Pi where 0≤i≤p-1 do S=S+L (2.1) L=0 (2.4) unlock(S) (2.2) for j=i to n step p do end for L=L+aj End end for 国家高性能计算中心(合肥) 2019/4/23

并行算法的通讯 通讯 通讯语句示例 共享存储多处理器使用:global read(X,Y)和global write(X,Y) 分布存储多计算机使用:send(X,i)和receive(Y,j) 通讯语句示例 算法4.2 分布存储多计算机上矩阵向量乘算法 输入:处理器数p, A划分为B=A[1..n,(i-1)r+1..ir], x划分为w=w[(i-1)r+1;ir] 输出:P1保存乘积AX Begin (1) Compute z=Bw (2) if i=1 then yi=0 else receive(y,left) endif (3) y=y+z (4) send(y,right) (5) if i=1 then receive(y,left) End 国家高性能计算中心(合肥) 2019/4/23

第四章 并行算法的设计基础 4.1 并行算法的基础知识 4.2 并行计算模型 第四章 并行算法的设计基础 4.1 并行算法的基础知识 4.2 并行计算模型

4.2 并行计算模型 4.2.1 PRAM模型 4.2.2 异步APRAM模型 4.2.3 BSP模型 4.2.4 logP模型

Interconnection Network PRAM模型 基本概念 由Fortune和Wyllie1978年提出,又称SIMD-SM模型。有一个集中的共享存储器和一个指令控制器,通过SM的R/W交换数据,隐式同步计算。 结构图 Control Unit Interconnection Network P LM Shared Memory 国家高性能计算中心(合肥) 2019/4/23

PRAM模型 分类 计算能力比较 PRAM-CRCW并发读并发写 PRAM-CREW并发读互斥写 PRAM-EREW互斥读互斥写 CPRAM-CRCW(Common PRAM-CRCW):仅允许写入相同数据 PPRAM-CRCW(Priority PRAM-CRCW):仅允许优先级最高的处理器写入 APRAM-CRCW(Arbitrary PRAM-CRCW):允许任意处理器自由写入 PRAM-CREW并发读互斥写 PRAM-EREW互斥读互斥写 计算能力比较 PRAM-CRCW是最强的计算模型,PRAM-EREW可logp倍模拟PRAM-CREW和PRAM-CRCW 国家高性能计算中心(合肥) 2019/4/23

PRAM模型 优点 缺点 适合并行算法表示和复杂性分析,易于使用,隐藏了并行机的通讯、同步等细节。 不适合MIMD并行机,忽略了SM的竞争、通讯延迟等因素 国家高性能计算中心(合肥) 2019/4/23

4.2 并行计算模型 4.2.1 PRAM模型 4.2.2 异步APRAM模型 4.2.3 BSP模型 4.2.4 logP模型

异步APRAM模型 基本概念 又称分相(Phase)PRAM或MIMD-SM。每个处理器有其局部存储器、局部时钟、局部程序;无全局时钟,各处理器异步执行;处理器通过SM进行通讯;处理器间依赖关系,需在并行程序中显式地加入同步路障。 指令类型 (1)全局读 (2)全局写 (3)局部操作 (4)同步 国家高性能计算中心(合肥) 2019/4/23

异步APRAM模型 计算过程 由同步障分开的全局相组成 国家高性能计算中心(合肥) 2019/4/23

异步APRAM模型 计算时间 设局部操作为单位时间;全局读/写平均时间为d,d随着处理器数目的增加而增加;同步路障时间为B=B(p)非降函数。 满足关系 ; 或 令 为全局相内各处理器执行时间最长者,则APRAM上的计算时间为 优缺点 易编程和分析算法的复杂度,但与现实相差较远,其上并行算法非常有限,也不适合MIMD-DM模型。 国家高性能计算中心(合肥) 2019/4/23

4.2 并行计算模型 4.2.1 PRAM模型 4.2.2 异步APRAM模型 4.2.3 BSP模型 4.2.4 logP模型

BSP模型 基本概念 由Valiant(1990)提出的,“块”同步模型,是一种异步MIMD-DM模型,支持消息传递系统,块内异步并行,块间显式同步。 模型参数 p:处理器数(带有存储器) l:同步障时间(Barrier synchronization time) g:带宽因子(time steps/packet)=1/bandwidth 国家高性能计算中心(合肥) 2019/4/23

BSP模型 计算过程 优缺点 由若干超级步组成, 每个超级步计算模式为左图 强调了计算和通讯的分离, 提供了一个编程环境,易于 程序复杂性分析。但需要显 式同步机制,限制至多h条 消息的传递等。 国家高性能计算中心(合肥) 2019/4/23

4.2 并行计算模型 4.2.1 PRAM模型 4.2.2 异步APRAM模型 4.2.3 BSP模型 4.2.4 logP模型

logP模型 基本概念 由Culler(1993)年提出的,是一种分布存储的、点到点通讯的多处理机模型,其中通讯由一组参数描述,实行隐式同步。 模型参数 L:network latency o:communication overhead g:gap=1/bandwidth P:#processors 注:L和g反映了通讯网络的容量 国家高性能计算中心(合肥) 2019/4/23

logP模型 优缺点 捕捉了MPC的通讯瓶颈,隐藏了并行机的网络拓扑、路由、协议,可以应用到共享存储、消息传递、数据并行的编程模型中;但难以进行算法描述、设计和分析。 BSP vs. LogP BSPLogP:BSP块同步BSP子集同步BSP进程对同步=LogP BSP可以常数因子模拟LogP,LogP可以对数因子模拟BSP BSP=LogP+Barriers-Overhead BSP提供了更方便的程设环境,LogP更好地利用了机器资源 BSP似乎更简单、方便和符合结构化编程 国家高性能计算中心(合肥) 2019/4/23