中国科学技术大学计算机科学与技术系 国家高性能计算中心(合肥) 2004年12月

Slides:



Advertisements
Similar presentations
七年级数学校本课程 台山市任远中学 李锦明. 1. 最古老的过河问题 1. 最古老的过河问题 一个农民携带一只狼,一只羊和一 箱卷心菜,要借助一条小船过河。 小船上除了农民只能再带狼、羊、 卷心菜中的一样。而农民不在时, 狼会吃羊,羊会吃菜。农民如何过 河呢?
Advertisements

台南市立後甲國中 訓導工作簡報 報告人:訓導主任 傅寶源 歡迎蒞臨指導. 訓導處是一個關懷學生生活問題、處理 學生生活事務的溫馨園地,舉凡生活常 規、安全防護、交通安全之教育,民主 法治、社團活動、訓育活動之訓練,衛 生習慣、飲食健康、預防疾病之培養, 體育活動,運動競賽、身心健康之鍛練, 均有專人專責為同學服務。
电子商务专业人才培养方案 五年制高职. 一、招生对象、学制与办学层次  (一)招生对象:初中毕业生  (二)学制:五年  (三)办学层次:专科.
年輕駕駛交通工具 考上駕照的 18 歲, 正好是高中畢業, 離家工作、上大學 的時候。 年輕人對新環境的 好奇及生疏,以及 尚未養成良好駕駛 習慣,造成意外的 產生。
興南國小強化體適能活動 學務處體育組 ( ) 此檔案家長可在學校首頁行政公告下載. 教育部體適能常模 坐姿體前彎 ( 公分 ) 立定跳遠 ( 公分 ) 仰臥起坐 ( 次 ) 心肺適能 ( 分秒 ) 10 歲男 / 女生 PR25 常模標準 19/24 119/110 19/19 347/353.
說 劍 《莊子‧雜篇》─ 第 一 組 賴泊錞 謝孟儒 張維真 羅苡芸
德 国 鼓 励 生 育 的 宣 传 画.
王同学的苦恼﹗ MC 4.1 诚可贵﹗.
新編多元性向測驗 測驗說明 輔導室
營利事業所得稅查核準則 相關概念介紹 南區國稅局 新營分局 林俊標 各位學員大家好:
在《命运交响曲》 音乐声中 安静我们的心 迎接挑战.
中國古典文獻學 主講:羅積勇教授.
101年國中畢業生多元進路宣導 國中部註冊組 100年10月29日.
高中職優質化專題 教育研究博士班二年級 游宗輝.
海星國中部直升方案說明 報告人:教務處 陳博文主任
第十章 图像的频域变换.
101年度十二年國民基本教育 國民中學校長專業研習 校長落實補救教學、適性輔導 中輟生的預防與復學輔導之實務作為
102年10月17日 臺北市公共運輸處 報告人:陳榮明處長
歡迎各位老師 蒞校參訪 召集人、各位委員、同仁大家好,我是林淑玟,負責教務行政進行簡報 報告人:林淑玟 中華民國九十九年三月二十三日.
大學甄選入學 選填志願輔導說明會 曾文農工輔導室.
一所具有悠久歷史與優良傳統的 優質學校 強調生活教育與精緻教學 是您有心向學的最佳選擇.
總務處報告 總務處 林蕙雅組長.
数据结构(C语言版) Data Structure
國立嘉義高級工業職業學校 101年度綜合高中宣導研習 國立嘉義高工 教務主任 林章明
期末测试讲评.
學 號:997I0010、997I0024 組 員:洪韋鈴、王婷婷 日 期: 指導老師:王立杰 老師
推行使用散装预拌砂浆 全面贯彻落实禁现政策
项目2-1 店铺的定位.
海軍軍官學校 士官二專班 招生簡報 、 第1頁,共30頁.
海軍軍官學校 士官二專班 103學年度 招生簡報.
公司法(六) 股份有限公司 1.
中学生心理健康讲座 打开心灵之门 开启阳光之路 主讲人:范荃.
第4章 种群和群落 第3节 群落的结构 自主学习案   合作探究案 课后练习案. 第4章 种群和群落 第3节 群落的结构 自主学习案   合作探究案 课后练习案.
第十三章 收入和利润.
教育部宣導專員 國立臺中家商 許敏政主任 101年2月23日製作 #201~203
第2讲 绪论(二).
并行计算 Parallel Computing
并行计算 Parallel Computing
中国科学技术大学计算机科学与技术系 国家高性能计算中心(合肥) 2004年12月
习题解答.
中国科学技术大学计算机科学与技术系 国家高性能计算中心(合肥) 2004年12月
第4章 非线性规划 一维搜索方法 2011年11月.
§2 求导法则 2.1 求导数的四则运算法则 下面分三部分加以证明, 并同时给出相应的推论和例题 .
Biomedical signal processing
中国科学技术大学计算机系 陈香兰(0551- ) Spring 2009
十二年國民基本教育 103學年度高中高職及五專 入學方式與就學區規劃 (草案諮詢稿)
106年度 南科智慧製造產業聚落推動計畫 場域型計畫結案報告簡報格式 (簡報時請將此頁刪除).
1.3 算法案例 第一课时.
线性代数 第二章 矩阵 §1 矩阵的定义 定义:m×n个数排成的数表 3) 零矩阵: 4) n阶方阵:An=[aij]n×n
中国科学技术大学计算机科学与技术系 国家高性能计算中心(合肥) 2004年12月
中国科学技术大学计算机科学与技术系 国家高性能计算中心(合肥) 2004年12月
离散数学─归纳与递归 南京大学计算机科学与技术系
高中職多元進路 家長說明會 主講人: 東莞台商子弟學校 麥馨月 日 期:
2.2矩阵的代数运算.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
线 性 代 数 厦门大学线性代数教学组 2019年5月12日4时19分 / 45.
2019/5/21 实验一 离散傅立叶变换的性质及应用 实验报告上传到“作业提交”。 11:21:44.
國立嘉義高級工業職業學校 101年度雲嘉區綜合高中宣導研習 國立嘉義高工 綜高高中學務組長 呂明欣
§2 方阵的特征值与特征向量.
百艳图.
99年基測暨直升、原藝班、 申請、甄選入學報名作業說明
第四章 快速傅里叶变换 §4-1 引言 频域分析:一种有效的工具 DFT: △ 问题:.
教学大纲(甲型,54学时 ) 教学大纲(乙型, 36学时 )
插入排序的正确性证明 以及各种改进方法.
离散数学─归纳与递归 南京大学计算机科学与技术系
第三章 线性方程组 §4 n维向量及其线性相关性(续7)
解题报告 七(5)班 严崟杰 03:20.
臺灣北區102學年度高級中等學校 舞蹈班暨聯合甄選入學術科測驗 暨甄選入學說明會
台中市黎明國中105學年度 學生報考 一般智能暨學術性向資賦優異學生鑑定 報名流程說明
Presentation transcript:

中国科学技术大学计算机科学与技术系 国家高性能计算中心(合肥) 2004年12月 并 行 计 算 中国科学技术大学计算机科学与技术系 国家高性能计算中心(合肥) 2004年12月

第三篇 并行数值算法 第八章 基本通讯操作 第九章 稠密矩阵运算 第十章 线性方程组的求解 第十一章 快速傅里叶变换 第三篇 并行数值算法 第八章 基本通讯操作 第九章 稠密矩阵运算 第十章 线性方程组的求解 第十一章 快速傅里叶变换

第十一章 快速傅里叶变换 11.1 快速傅里叶变换 11.2 并行FFT算法

11. 1 快速傅里叶变换(FFT) 11. 1. 1 离散傅里叶变换(DFT) 11. 1. 2 DFT的顺序代码 11. 1 11.1 快速傅里叶变换(FFT) 11.1.1 离散傅里叶变换(DFT) 11.1.2 DFT的顺序代码 11.1.3 串行FFT递归算法 11.1.4 串行FFT非递归算法

离散傅里叶变换(DFT) 定义 给定向量A=(a0,a1,…,an-1)T,DFT将A变换为B=(b0,b1,…,bn-1)T 国家高性能计算中心(合肥) 2019/1/1

11. 1 快速傅里叶变换(FFT) 11. 1. 1 离散傅里叶变换(DFT) 11. 1. 2 DFT的顺序代码 11. 1 11.1 快速傅里叶变换(FFT) 11.1.1 离散傅里叶变换(DFT) 11.1.2 DFT的顺序代码 11.1.3 串行FFT递归算法 11.1.4 串行FFT非递归算法

DFT的顺序代码 代码1 代码2 注:代码1需要计算ωk*j b[j]=0 for k=0 to n-1 do for j=0 to n-1 do b[j]=0 for k=0 to n-1 do b[j]=b[j]+ωk*ja[k] end for 注:代码1需要计算ωk*j 代码2的复杂度为O(n2) 代码2 w=ω0 for j=0 to n-1 do b[j]=0, s=ω0 for k=0 to n-1 do b[j]=b[j]+s*a[k] s=s*w end for w=w*ω 国家高性能计算中心(合肥) 2019/1/1

11. 1 快速傅里叶变换(FFT) 11. 1. 1 离散傅里叶变换(DFT) 11. 1. 2 DFT的顺序代码 11. 1 11.1 快速傅里叶变换(FFT) 11.1.1 离散傅里叶变换(DFT) 11.1.2 DFT的顺序代码 11.1.3 串行FFT递归算法 11.1.4 串行FFT非递归算法

串行FFT递归算法 蝶式递归计算原理 令 为n/2次单位元根,则有 . 将b向量的偶数项 和奇数项 分别记为 和 注意推导中反复使用 国家高性能计算中心(合肥) 2019/1/1

串行FFT递归算法 国家高性能计算中心(合肥) 2019/1/1

串行FFT递归算法 国家高性能计算中心(合肥) 2019/1/1

串行FFT递归算法 FFT的蝶式递归计算图(由计算原理推出) 国家高性能计算中心(合肥) 2019/1/1

串行FFT递归算法 特别地,n=8的FFT蝶式计算图(展开的) 国家高性能计算中心(合肥) 2019/1/1

串行FFT递归算法 SISD上的FFT分治递归算法 Procedure RFFT(a,b) begin 输入: a=(a0,a1,…,an-1); 输出: B=(b0,b1,…,bn-1) Procedure RFFT(a,b) begin if n=1 then b0=a0 else (1)RFFT(a0,a2,…,an-2, u0,u1,…,un/2-1) (2)RFFT(a1,a3,…,an-1, v0,v1,…,vn/2-1) (3)z=1 (4)for j=0 to n-1 do (4.1)bj=uj mod n/2+zvj mod n/2 (4.2)z=zω endfor 注: (1)算法时间复杂度t(n)=2t(n/2)+O(n) endif 解得 t(n)=O(nlogn) end (2)算法原理? 国家高性能计算中心(合肥) 2019/1/1

11. 1 快速傅里叶变换(FFT) 11. 1. 1 离散傅里叶变换(DFT) 11. 1. 2 DFT的顺序代码 11. 1 11.1 快速傅里叶变换(FFT) 11.1.1 离散傅里叶变换(DFT) 11.1.2 DFT的顺序代码 11.1.3 串行FFT递归算法 11.1.4 串行FFT非递归算法

串行FFT非递归算法 蝶式计算示例 国家高性能计算中心(合肥) 2019/1/1

串行FFT非递归算法 蝶式计算流图 国家高性能计算中心(合肥) 2019/1/1

串行FFT非递归算法 行0 行1 行2 行3 行4 行5 行6 行7 如: b6=[(a0+a4)-(a2+a6)]-[(a1+a5)-(a3+a7)]ω2 注: ①下行线结点处的权因子的确定问题; ②bi的下标确定:取行号的位序反。如,行3: 3=(011)2 ==>(110)2=6, ==> 行3的输出为b6 国家高性能计算中心(合肥) 2019/1/1

第十一章 快速傅里叶变换 11.1 快速傅里叶变换 11.2 并行FFT算法

11.2 并行FFT算法 11.2.1 SIMD-MC2上的FFT算法 11.2.2 SIMD-BF上的FFT算法

SIMD-MC2上的FFT算法 算法描述 n个处理器组成n1/2×n1/2的方阵, 处理器以行主序编号 国家高性能计算中心(合肥) 2019/1/1

SIMD-MC2上的FFT算法 算法11.3(P270): 输入: ak处于Pk中; 输出bk处于Pk中 Begin (1)for k=0 to n-1 par-do ck=ak endfor (2)for h=logn-1 to 0 do for k=0 to n-1 par-do (2.1)p=2h (2.2)q=n/p (2.3)z=ωp //先算出ωn/2,以后每次z=z1/2 (2.4)if ( k mod p = k mod 2p) then par-do //满足条件的处理器同时做 (i) ck=ck+ck+pzr(k)modq //(i)和(ii)同时执行 (ii)ck+p=ck-ck+pzr(k)modq endif endfor (3)for k=0 to n-1 par-do bk=cr(k) endfor //r(k)为k的位序反 End 如:n=16 h=3, p=8, q=2, z=ω8 h=2, p=4, q=4, z=ω4 h=1, p=2, q=8, z=ω2 h=0, p=1, q=16,z=ω1 国家高性能计算中心(合肥) 2019/1/1

SIMD-MC2上的FFT算法 示例: P271例11.5, n=4 第(1)步: 国家高性能计算中心(合肥) 2019/1/1

SIMD-MC2上的FFT算法 第(2)步: 第1次迭代(h=1): p=2, q=2, z=ω2 满足k mod 2 = k mod 4的处理器为P0和P1, 同时计算 P0: c0=c0+(ω2)0c2=a0+a2 P1: c1=c1+(ω2)0c3=a1+a3 c2=c0-(ω2)0c2=a0-a2 c3=c1-(ω2)0c3=a1-a3 国家高性能计算中心(合肥) 2019/1/1

SIMD-MC2上的FFT算法 第(2)步: 第2次迭代(h=0): p=1, q=4, z=ω 满足k mod 1 = k mod 2的处理器为P0和P2, 同时计算 P0: c0=c0+ω0c1=(a0+a2)+(a1+a3) P2: c1=c1+ω1c3=(a0+a2)+(a1+a3)ω c1=c0-ω0c1=(a0+a2)-(a1+a3) c3=c1-ω1c3=(a0+a2)+(a1+a3)ω 国家高性能计算中心(合肥) 2019/1/1

SIMD-MC2上的FFT算法 算法分析 第(3)步: b0=c0, b1=c2, b2=c1, b3=c3 计算时间: tcomp=O(logn) 选路时间: trouting: 只涉及(2.4)和(3) (2.4): O(n1/2) (3): O(n1/2) 综上, 当n较大时t(n)=O(n1/2) 国家高性能计算中心(合肥) 2019/1/1

11.2 并行FFT算法 11.2.1 SIMD-MC2上的FFT算法 11.2.2 SIMD-BF上的FFT算法

SIMD-BF上的FFT算法 蝶形网络 处理器布局 有k+1层, 每层有n=2k个处理器, 共有n(1+logn)个处理器 第r行第i列的处理器记为Pr,i, i=(a1,a2,…,ak)2 互连方式 Pr,i与上层Pr-1,i, Pr-1,j相连, 这里i的第r位为0 Pr,j与上层Pr-1,i, Pr-1,j相连, 这里j与i仅在第r位不同 权因子ω在BF网络中的计算方法 Pr,i中ω的指数为j=exp(r,i) 这里exp(r,i)=(ar,…,a1,0,…,0) //即i的前r位取位序反,再后补0 k-r 国家高性能计算中心(合肥) 2019/1/1

SIMD-BF上的FFT算法 示例: n=8的BF网络表示 r,i与上层Pr-1,i, Pr-1,j相连, 这里i的第r位为0 Pr,j与上层Pr-1,i, Pr-1,j相连, 这里j与i仅在第r位不同 国家高性能计算中心(合肥) 2019/1/1

SIMD-BF上的FFT算法 算法描述: P272算法11.4 算法分析 算法的正确性可以用归纳法证明 时间分析 第(1)步时间: O(1) (2.1)和(2.2)的计算时间为O(1), (假定ωexp(r,i)已计算好) (2.1)和(2.2)的选路时间为O(1) ==>第(2)步时间: O(logn) 所以 t(n)=O(logn), p(n)=n(1+logn), c(n)=O(nlog2n) Sp(n)=O(n), Ep(n)=O(1/logn) //本算法的综合指标是较好的 ωexp(r,i)的计算 初始时: Pk,i读入ωexp(k,i),k=logn 若Pr+1,i已有ωexp(r+1,i), 则Pr,i中的ωexp(r,i)=ω2exp(r+1,i) 所以, 经过logn步就可以计算出每个ωexp(r,i) 国家高性能计算中心(合肥) 2019/1/1