中国科学技术大学计算机科学与技术系 国家高性能计算中心(合肥) 2004年12月

Slides:



Advertisements
Similar presentations
完美殺人筆記簿 【爸!我受夠了!】 第七組組員: 林正敏 陳筱涵 李蓓宇 許純宜 羅玉芬 謝文軒.
Advertisements

排列 组合 概率 会考复习. 排列、组合是不同的两个事件,区别的 标志是有无顺序,而区分有无顺序的办法是: 把问题的一个选择结果解出来,然后交换这 个结果中任意两个元素的位置,看是否会产 生新的变化,若有新变化,即说明有顺序, 是排列问题;若无新变化,即说明无顺序, 为组合问题 知识要点.
第九章 常微分方程数值解法 §1 、引言. 微分方程的数值解:设方程问题的解 y(x) 的存在区间是 [a,b] ,令 a= x 0 < x 1
1 4.5 高斯求积公式 一般理论 求积公式 含有 个待定参数 当 为等距节点时得到的插值求积公式其代数精度至少 为 次. 如果适当选取 有可能使求积公式 具有 次代数精度,这类求积公式称为高斯 (Gauss) 求积公式.
常系数线性微分方程组 §5.3 常系数线性方程组. 常系数线性微分方程组 一阶常系数线性微分方程组 : 本节主要讨论 (5.33) 的基解矩阵的求法.
1 第四章 数值积分与数值微分 — 多重积分 — 数值微分. 2 本讲内容 基本思想 计算方法 二重积分 问题描述 计算方法 数值微分.
计算机数学基础(下) --数值分析 教师:孙继荣 电话: 028 -
1.3 二项式定理. [ 题后感悟 ] 方法二较为简单,在展开二项式之前根据二项 式的结构特征进行适当变形,可使展开多项式的过程简化.记 准、记熟二项式 (a + b) n 的展开式,是解答好与二项式定理有关 问题的前提,对较复杂的二项式,有时可先化简再展开,会更 简便.
XX啤酒营销及广告策略.
3.1.1 随机事件的概率(一).
代数方程总复习 五十四中学 苗 伟.
§1 二阶与三阶行列式 ★二元线性方程组与二阶行列式 ★三阶行列式
一、二阶行列式的引入 用消元法解二元线性方程组. 一、二阶行列式的引入 用消元法解二元线性方程组.
2.2.1 等比数列的概念和通项公式.
数列(一) 自强不息和谐发展 授课教师:喻永明.
第三章 函数逼近 — 最佳平方逼近.
第三章 解线性方程组的直接法 (3.1) AX = b.
第四章 概率密度函数的非参数估计 2学时.
第五章 矩阵与行列式 §5.4 逆矩阵 §5.5 矩阵的初等变换.
电话联系.
迎宾员礼仪 包头机电工业职业学校管理系 白琳 1.
命题的四种形式 高二数学.
关于全国高校数学微课程 教学设计竞赛 林亚南 2015年12月12日.
第五章 定积分及其应用.
财 务 会 计 第四篇:供应链会计实务 制作人:谌君、熊瑜.
北师大版七年级数学 5.5 应用一元一次方程 ——“希望工程”义演 枣庄市第三十四中学 曹馨.
第三讲 矩阵特征值计算及其应用 — 正交变换与QR方法.
海洋存亡 匹夫有责 ——让我们都来做环保小卫士 XX小学三(3)班.
第五章 解线性方程组的直接方法 §5.1 引 言 线性方程组: (5.1) 1 结束.
例1.设 求AB..
第2讲 线性方程组解的存在性 主要内容: 1. 线性方程组的解 2.线性方程组的同解变换与矩阵的初等行变换
中国科学技术大学计算机科学与技术系 国家高性能计算中心(合肥) 2004年12月
并行编译简介.
并行计算 Parallel Computing
并行计算 Parallel Computing
习题解答.
Gaussian Elimination 東海大學物理系‧數值分析 施奇廷.
中国科学技术大学计算机科学与技术系 国家高性能计算中心(合肥) 2004年12月
中国科学技术大学计算机系 陈香兰(0551- ) Spring 2009
第一章 行 列 式 在初等数学中,我们用代入消元法或加减消元法求解 二元和三元线性方程组,可以看出,线性方程组的解完
第三章 线性代数方程组的解法 在自然科学和工程技术中很多问题的解决常常归结为解线性代数方程组。例如: (蓝色)建筑工程中的结构力学问题;
导数的应用 ——函数的单调性与极值.
第5章 线性代数 矩阵分析 矩阵分解 线性方程组的求解 符号矩阵.
第八章 线性方程组 的迭代解法.
第二节 极限 一、数列极限 定义:.
健康體育網路護照操作 STEP1 於教育部體適能網站進入「健康體育網路護照」.
1.3 算法案例 第一课时.
线性代数 第二章 矩阵 §1 矩阵的定义 定义:m×n个数排成的数表 3) 零矩阵: 4) n阶方阵:An=[aij]n×n
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
中国科学技术大学计算机科学与技术系 国家高性能计算中心(合肥) 2004年12月
并行计算 Parallel Computing
4) 若A可逆,则 也可逆, 证明: 所以.
建模常见问题MATLAB求解  .
第一节 动态规划问题 §1.1 多阶段决策问题 §1.2 动态规划问题举例 精品课程《运筹学》
2.2矩阵的代数运算.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
线 性 代 数 厦门大学线性代数教学组 2019年5月12日4时19分 / 45.
A经有限次初等变换化为B,称A与B等价,记作A→B.
§2 方阵的特征值与特征向量.
第五节 线性方程组有解判别定理 一、线性方程组的向量表示形式 二、线性方程组有解判别定理 三、一般线性方程组的解法 四、线性方程组的求解步骤.
第三章 线性方程组的解法 3.1 引言 3.2 解线性方程组的消去法 3.3 解线性方程组的矩阵分解法 3.4 解线性方程组的迭代法.
在发明中学习 线性代数概念引入 之四: 矩阵运算 李尚志 中国科学技术大学.
定义5 把矩阵 A 的行换成同序数的列得到的矩阵,
教学大纲(甲型,54学时 ) 教学大纲(乙型, 36学时 )
第10章 代数方程组的MATLAB求解 编者.
第六章 线性方程组的迭代法 — Jacobi, G-S and SOR.
第6章 解线性方程组的迭代法 直接法得到的解是理论上准确的,但是我们可以看得出,它们的计算量都是n3
第2章 线性代数方程组.
§4.5 最大公因式的矩阵求法( Ⅱ ).
数列求和 Taojizhi 2019/10/13.
Presentation transcript:

中国科学技术大学计算机科学与技术系 国家高性能计算中心(合肥) 2004年12月 并 行 计 算 中国科学技术大学计算机科学与技术系 国家高性能计算中心(合肥) 2004年12月

第三篇 并行数值算法 第八章 基本通讯操作 第九章 稠密矩阵运算 第十章 线性方程组的求解 第十一章 快速傅里叶变换 第三篇 并行数值算法 第八章 基本通讯操作 第九章 稠密矩阵运算 第十章 线性方程组的求解 第十一章 快速傅里叶变换

第十章 线性方程组的求解 10. 1 三角形方程组的求解 10. 2 三对角方程组的求解 10. 3 稠密线性方程组的求解 10 第十章 线性方程组的求解 10.1 三角形方程组的求解 10.2 三对角方程组的求解 10.3 稠密线性方程组的求解 10.4 稀疏线性方程组的求解

10.1 三角形方程组的求解 10.1.1 基本术语 10.1.2 上三角方程组的求解 10.1 三角形方程组的求解 10.1.1 基本术语 10.1.2 上三角方程组的求解

基本术语 线性方程组的定义和符号 a1,1x1 + a1,2x2 + … + a1,nxn = b1 an,1x1 + an,1x2 + … + an,nxn = bn 记为 AX=b 国家高性能计算中心(合肥) 2019/1/2

10.1 三角形方程组的求解 10.1.1 基本术语 10.1.2 上三角方程组的求解 10.1 三角形方程组的求解 10.1.1 基本术语 10.1.2 上三角方程组的求解

上三角方程组的求解 上三角方程组的回代解法并行化 (1)SISD上的回代算法 Begin (1)for i=n downto 1 do (1.1)xi=bi/aii (1.2)for j=1 to i-1 do bj=bj-ajixi aji=0 endfor End 可并行化 国家高性能计算中心(合肥) 2019/1/2

上三角方程组的求解 上三角方程组的回代解法并行化 (2)SIMD-CREW上的并行回代算法 - 划分: p个处理器行循环带状划分 - 算法 Begin for i=n downto 1 do xi=bi/aii for all Pj, where 1≤j≤p do for k=j to i-1 step p do bk=bk-akixi aki=0 endfor End // p(n)=n, t(n)=n 国家高性能计算中心(合肥) 2019/1/2

第十章 线性方程组的求解 10. 1 三角形方程组的求解 10. 2 三对角方程组的求解 10. 3 稠密线性方程组的求解 10 第十章 线性方程组的求解 10.1 三角形方程组的求解 10.2 三对角方程组的求解 10.3 稠密线性方程组的求解 10.4 稀疏线性方程组的求解

10.2 三对角方程组的求解 10.2.1 直接求解法 10.2.2 奇偶规约法

三对角方程组的直接求解法 Gauss消去法(难以并行化) ①消元 ②回代 注:由于三对角的 方程组的特殊性, 一次消元或一次 回代,只涉及邻 近一个方程,故 难以并行化。 国家高性能计算中心(合肥) 2019/1/2

10.2 三对角方程组的求解 10.2.1 直接求解法 10.2.2 奇偶规约法

三对角方程组的直接求解法 奇偶规约求解法(可并行化) fixi-1+gixi+hixi+1=bi i=1~n f1=hn=0 串行算法描述 三对角方程可以写成如下形式 fixi-1+gixi+hixi+1=bi i=1~n f1=hn=0 串行算法描述 ①利用上下相邻方程消去偶序号方程中的奇下标变量: f2i-1x2i-2+g2i-1x2i-1+h2i-1x2i =b2i-1 f2ix2i-1 + g2ix2i + h2ix2i+1 =b2i f2i+1x2i +g2i+1x2i+1+h2i+1x2i+2 = b2i+1 2i-1方程乘上某个数消去2i方程中的f2ix2i-1项, 2i+1方程乘上某个数 消去2i方程中的h2ix2i+1项, 使2i方程变为 αix2i-2+βix2i+γix2i+2=ηi i=1,2,…,n/2 国家高性能计算中心(合肥) 2019/1/2

三对角方程组的直接求解法 并行化分析: ①、②消去奇下标可以并行化; ②重复①最终可得: case 1: case 2: g1x1+h1x2 =b1 . f2x1+g2x2+h2x3 =b2 . f3x2 +g3x3+h3x4=b3 . f4x3 +g4x4 =b4 . 可以分别得到 g1x1+h1x2 =b1 或 g1x1+h1x2 =b1 f2x1+g2x2 =b2 f2x1+g2x2+h2x3 =b2 f3x2+g3x3 =b3 解得 x1,x2 或 x1, x2, x3 ③回代求解x 并行化分析: ①、②消去奇下标可以并行化; ③回代求解可以并行化 国家高性能计算中心(合肥) 2019/1/2

第十章 线性方程组的求解 10. 1 三角形方程组的求解 10. 2 三对角方程组的求解 10. 3 稠密线性方程组的求解 10 第十章 线性方程组的求解 10.1 三角形方程组的求解 10.2 三对角方程组的求解 10.3 稠密线性方程组的求解 10.4 稀疏线性方程组的求解

10.3 稠密线性方程组的求解 10.3.1 有回代的高斯消去法 10.3.2 无回代的高斯-约旦法 10.3.3 迭代求解的高斯-赛德尔法 10.3 稠密线性方程组的求解 10.3.1 有回代的高斯消去法 10.3.2 无回代的高斯-约旦法 10.3.3 迭代求解的高斯-赛德尔法

有回代的高斯消去法 算法基本原理 求解过程分为消元和回代两个阶段,消元是将系数矩阵A化为上三角阵T,然后对TX=c进行回代求解。 消元过程中可以应用选主元方法,增加算法的数值稳定性。 下面是消元过程图: 国家高性能计算中心(合肥) 2019/1/2

有回代的高斯消去法 并行化分析 消元和回代均可以并行化; 选主元也可以并行化; 消元过程的并行化图示:处理器按行划分 国家高性能计算中心(合肥) 2019/1/2

10.3 稠密线性方程组的求解 10.3.1 有回代的高斯消去法 10.3.2 无回代的高斯-约旦法 10.3.3 迭代求解的高斯-赛德尔法 10.3 稠密线性方程组的求解 10.3.1 有回代的高斯消去法 10.3.2 无回代的高斯-约旦法 10.3.3 迭代求解的高斯-赛德尔法

无回代的高斯-约旦法 串行算法原理 ①消元: 通过初等行变换,将(A,b)化为主对角线矩阵, (方便起见, 记b为A的第n+1列) ②求解: xj=a’j,n+1/a’jj 国家高性能计算中心(合肥) 2019/1/2

无回代的高斯-约旦法 SIMD-CREW上的并行算法 (1)处理器: n2+n个处理器, 这些处理器排成n×(n+1)的矩阵, 处理器编号为Pik, i=1~n, k=1~n+1 (2)并行化分析 ①消元的并行化: // O(n) for j=1 to n-1, each Pik Par-do //第j次消元 Pij(i<>j): aij <— 0 Pik(i<>j, k=j+1~n+1): aik <— aik-ajk(aij/ajj) end for ②求解: for each Pjj(j=1~n) Par-do: xj <— aj,n+1/ajj //O(1) (3)时间分析: t(n)=O(n), p(n)=O(n2), c(n)=O(n3) 成本最优? 国家高性能计算中心(合肥) 2019/1/2

无回代的高斯-约旦法 成本最优? 串行算法的最优时间:由于 x=A-1b ①A-1b(假设已有A-1): O(n2) ②求A-1: ∴求A-1需要: 2次n/2×n/2矩阵的逆 i(n/2) 6次n/2×n/2矩阵的乘 m(n/2) 2次n/2×n/2矩阵的加 a(n/2) i(n)=i(n/2)+6m(n/2)+2a(n/2) a(n/2)=n2/2, m(n/2)=O((n/2)x) 2<x<2.5 => i(n)=O(nx) 综上,串行算法的最优时间为O(nx) 2<x<2.5 国家高性能计算中心(合肥) 2019/1/2

10.3 稠密线性方程组的求解 10.3.1 有回代的高斯消去法 10.3.2 无回代的高斯-约旦法 10.3.3 迭代求解的高斯-赛德尔法 10.3 稠密线性方程组的求解 10.3.1 有回代的高斯消去法 10.3.2 无回代的高斯-约旦法 10.3.3 迭代求解的高斯-赛德尔法

迭代求解的高斯-赛德尔法 串行算法原理 并行化分析 如果对某个k, 给定的误差允许值c有 则认为迭代是收敛的。 由于每次迭代需要使用本次迭代的前面部分值,因而难以 得到同步的并行算法,下面给出一个异步的并行算法。 国家高性能计算中心(合肥) 2019/1/2

迭代求解的高斯-赛德尔法 MIMD异步并行算法 Begin N个处理器(N≤n)生成n个进程, 每个进程计算x的一个分量 算法 (1)oldi  xi0, newi  xi0 (2)生成进程i (3)进程i repeat (i) oldi  newi (ii)newi  (bi-∑k<iaik×oldk-∑k>iaik×oldk)/aii until ∑i=1~n| oldi - newi |<c xi  newi End 国家高性能计算中心(合肥) 2019/1/2

第十章 线性方程组的求解 10. 1 三角形方程组的求解 10. 2 三对角方程组的求解 10. 3 稠密线性方程组的求解 10 第十章 线性方程组的求解 10.1 三角形方程组的求解 10.2 三对角方程组的求解 10.3 稠密线性方程组的求解 10.4 稀疏线性方程组的求解

10. 4 稀疏线性方程组的求解 10. 4. 1 线性方程组的并行化方法 10. 4. 2 稀疏线性方程组的迭代解法 10. 4 10.4 稀疏线性方程组的求解 10.4.1 线性方程组的并行化方法 10.4.2 稀疏线性方程组的迭代解法 10.4.3 高斯-赛德尔迭代法的并行化

线性方程方程的并行化方法 线性方程组选择算法的考虑因素 系数矩阵A的结构 计算精度要求 计算环境要求 dense Gaussian elimination, etc Sparse iterative method triangular substitution, odd-even reduction certain PDEs multigrid, etc 计算精度要求 Gaussian elimination: more accurate, more expensive Conjugate gradients: less accurate, less expensive 计算环境要求 architecture, available languages, compiler quality libraries? 国家高性能计算中心(合肥) 2019/1/2

线性方程方程的并行化方法 求解方法的并行化 (1)直接解法的并行化(用于稠密线性方程组) - Gauss消去法(包括选主元的Gauss消去法) - Gauss-Jordan消去法 - LU分解法 (2)迭代法的并行化(用于稠密和稀疏线性方程组) - Jacobi - Gauss-Seidel(可异步并行化) - Jacobi OverRelaxation(JOR) - Gauss-Seidel OverRelaxation(SOR) - Conjugate Gradient 国家高性能计算中心(合肥) 2019/1/2

10. 4 稀疏线性方程组的求解 10. 4. 1 线性方程组的并行化方法 10. 4. 2 稀疏线性方程组的迭代解法 10. 4 10.4 稀疏线性方程组的求解 10.4.1 线性方程组的并行化方法 10.4.2 稀疏线性方程组的迭代解法 10.4.3 高斯-赛德尔迭代法的并行化

稀疏线性方程方程的迭代解法 迭代解法 国家高性能计算中心(合肥) 2019/1/2

10. 4 稀疏线性方程组的求解 10. 4. 1 线性方程组的并行化方法 10. 4. 2 稀疏线性方程组的迭代解法 10. 4 10.4 稀疏线性方程组的求解 10.4.1 线性方程组的并行化方法 10.4.2 稀疏线性方程组的迭代解法 10.4.3 高斯-赛德尔迭代法的并行化

高斯-赛德尔迭代法的并行化 由PDE离散产生的稀疏线性方程组 (1)Laplace方程 国家高性能计算中心(合肥) 2019/1/2

高斯-赛德尔迭代法的并行化 (2)由五点格式的离散化(假设g(x,y)=0) 国家高性能计算中心(合肥) 2019/1/2

高斯-赛德尔迭代法的并行化 A为稀疏的块三对角矩阵 国家高性能计算中心(合肥) 2019/1/2

高斯-赛德尔迭代法的并行化 Gauss-Seidel迭代解法的并行化 (1)两种串行算法的计算顺序及其并行化 顺序1 顺序2 顺序1 顺序2 注: 顺序1难以并行化;顺序2可以小规模并行化 国家高性能计算中心(合肥) 2019/1/2

高斯-赛德尔迭代法的并行化 (2) 红黑着色并行算法 ①并行计算所有的红点 ②并行计算所有的黑点 ③重复①、②直至满足精度要求 国家高性能计算中心(合肥) 2019/1/2