GPU分散式演算法設計與單機系統模擬(第二季)

Slides:



Advertisements
Similar presentations
定 格 入 格 破 格 —— 新诗仿写复习训练 仿照下列句子,再把 “ 人生 ” 比喻成 “ 大海 ”“ 天空 ” , 造两个句子。 如果说人生是一首优美的乐曲,那么痛苦则 是其中一个不可或缺的音符。 参考答案: 1 、如果说人生是一望无际的大海,那么挫折则 是其中一个骤然翻起的浪花。 2 、如果说人生是一片湛蓝的天空,那么失意则.
Advertisements

《微型计算机技术 及应用》 ( 第 4 版) —— 戴梅萼 史嘉权. 目标 深刻理解 牢固掌握 灵活应用.
台中市牙醫師公會 社會教育委員會 蔡佩音醫師 迎接新口腔時代. 蛀牙 v.s 全身疾病.
第二章 CPU 制作者:李天和.
美味料理 5223汪芮臣.
第 2 章 中央處理單元.
第一章 计算机基本知识 网考小组.
第一章 多核概述 使用多核了吗? 摩尔定律——芯片的晶体管数量每一年半左右增长一倍。 处理器性能不断提高主要基于两个原因:
上 班 族 身心健康操 陽明大學 運動健康科學 研究中心 編著.
境外中资企业机构和人员安全管理指南 ——境外人员和场所安全管理 中国对外承包工程商会安全管理专家.
赵永华 中科院计算机网络信息中心 超级计算中心
教育局資安課程 戒慎恐懼-談公務上的資安認知.
軍用電腦科技趨勢與產業應用 全科科技 陳以昌.
Chap4 電腦硬體基本單元 高中資訊科技概論 松崗圖書公司.
CPU 一、基本知识 二、常见品牌 三、评价指标 四、AMD VS Intel 五、单核与双核 六、多核
HP Pavilion g 系列新品培训 Trainer
電腦作業-CPU介紹 班級:117 座號:07號 姓名:周奕廷.
2013 澎湖自助旅行講座 澎湖,其實就是一片海洋 主辦:沿著菊島旅行 協辦: 台北澎湖同鄉會、台中澎湖同鄉會、高雄澎湖同鄉會
ACER商用笔记本产品介绍 ACER TM P243
第2章:企業組織 張緯良 世新大學資訊管理系.
史上最賣座動漫-海賊王 3/19/ 張依琳.
台灣雲端運算應用實驗中心研發計畫 計 畫 期 間:自98年7月1日至99年6月30日止 執行單位名稱 :財團法人資訊工業策進會 國立中山大學.
第一章 信息与信息技术 1.2 日新月异的信息技术.
HADOOP的高能物理分析平台 孙功星 高能物理研究所/计算中心
最新計算機概論 第3章 計算機組織.
第二章 计算机硬件基础 --微型计算机硬件的组成.
第2章 主机 李渊林 本章要点   CPU 主板 2.3   内存 2.4 机箱和电源.
第8章 机床操作 主讲:臧红彬 博士.
华南理工大学 陈虎 博士 多核处理器技术 华南理工大学 陈虎 博士
2011/08/12 第1章 计算机与计算思维 《大学计算机基础》.
第3章 微型计算机主机 3.1 中央处理器(CPU) 中央处理器CPU的英文全称是Central Processing Unit。它是微型计算机的核心部件,现代微机的CPU采用了超大规模集成电路技术及先进的封装技术将运算器、控制器、内部寄存器、高速缓存集成为一块芯片,因此它是微机中相对技术含量最高,且就单位重量或体积而言价值最高的一个部件。不同档次的微机即是以其CPU的档次来划分的,也就是说CPU的性能基本上就反映出一台微机的的性能。
報告人:王月杏 行動電話 台南市 九十九年度電腦維運相關事宜 報告人:王月杏 行動電話
99年台南市中小學電腦維運 --招標結果暨配發說明
IP路由器.
Hardware Chen Ching-Jung
3.1主板的组成 3.2主板分类 3.3主板的选购 3.4主流主板芯片组技术参数
2006年10月 面向数据处理的高端系统 胡雷钧 浪潮公司.
電腦硬體介紹暨 個人電腦採購指引 2018/9/18.
型號 – ASUS F3APT2YDD 規格 型號:ASUS F3APT2YDD-FBQCCCA 處理器:Intel Core Duo T2060 最新65奈米製程(1.6GHz,533MHz FSB ,2MB L2 Cache) 記憶體:1GB DDRII 螢幕:15.4" WXGA 鏡面寬螢幕.
主讲教师:唐大仕 第5讲 计算机硬件 主讲教师:唐大仕
第 2 章 中央處理單元.
電腦硬體基本介紹 國立高雄大學資訊工程學系 林士倫 2010/10/21.
第5章 中央處理單元與主記憶體 5-1 中央處理單元-CPU 5-2 主記憶體.
異質計算教學課程內容 「異質計算」種子教師研習營 洪士灝 國立台灣大學資訊工程學系
数字系统设计 I Digital System Design I
新電腦硬體 製作者: 陳卉茹 鄭如君.
CPU資料處理 醫務管理暨醫療資訊學系 陳以德 副教授: 濟世CS 轉
高效能運算服務 (High Performance Computing) 建置之經驗分享
計概作業 陳承詳.
计算机组装、维修及 实训教程 第2章 中央处理器 2018年11月19日星期一.
基于压缩算法的tile64多核处理器性能研究
HP Pro 2000 商用台式机 dx2310 HP Pro 2000 特性对比 机箱 芯片组 CPU 输入/输出插槽 内存 扩展仓 显卡
华南理工大学 陈虎 博士 CUDA编程模型 华南理工大学 陈虎 博士
胡維平 國立中正大學化學暨生物化學系 Aug. 30, 2017
GPU分散式演算法與CPU多執行緒演算法之單機系統模擬
Interference between and Bluetooth And coexistence mechanisms
PS3 and Xbox360 硬體解析 為您比較兩者的硬體效能差別 CPU GPU.
LAB 4- Hardware TA: Hu-Hsi Yeh Date: /28
計算機概論 第3章 計算機組織與結構概觀.
主流双核微处理器 技术分析及性能对比 陈丰 李宏量 孙瑜杰 计算机体系结构课程论文课堂报告.
胡維平 國立中正大學化學暨生物化學系 Aug. 22, 2018
计算机系统结构(2012年春) ----存储层次: Cache基本概念
微机原理与接口技术 ——第三章 80x86微处理器 西安邮电大学 计算机学院 范琳.
小米手机3介绍 为发烧而生.
GPU based online noise filtering algorithm in LHASSO-WCDA
谁在审判?谁能审判? ——网络舆论对司法判案的影响
MultiThread Introduction
暗房技術實驗 顯影 停影 定影 授課教授:莊東漢 林招松 教授 助教:朱峰民 實驗目的 暗房技術 實驗設備與材料 實驗結果 實驗原理
参赛流程指引 (如何下载平台及报名参赛).
中国科学院云南天文台博士毕业答辩 射电天文数据实时计算的关键技术研究 答辩人:戴伟 指导老师:王锋 学科专业: 天文技术与方法.
Presentation transcript:

GPU分散式演算法設計與單機系統模擬(第二季) 高雄大學 吳志宏

Outline OpenMP CUDA vs. OpenMP GPU Experiment Nvidia Tesla OpenMP with Tesla Conclusion 2/1/2010 ICAL

OpenMP Open Multi-Processing,OpenMP(only for Intel) OpenMP is an API to supports multi-platform shared memory multiprocessing programming in C/C++ and Fortran on all architectures. 2/1/2010 11/17/09 ICAL

OpenMP vs. CUDA OpenMP使用多核心CPU來運算 優點: 缺點: 可以平行化的程式比較多(允許較複雜程式) ,可 依照task目標來平行。 在CPU之中執行程式, 在memory的溝通上較快, 且無額外成本。 缺點: 在大量簡單資料處理上較慢, 因為核心數少。 只有Intel的產品支援。 2/1/2010 ICAL

OpenMP vs. CUDA(續) CUDA使用大量核心的GPU運算 優點:在處理資料量龐大而簡單的運算時,加 速非常明顯,可為CPU的數十倍甚至數 百倍。 缺點: 只能處理較簡單的運算。 資料精度受到限制,用double效能會大大降低。 在memory的溝通上較慢,有較多額外的I/O成本。 只有Nvidia Geforce 8系列以上的GPU支援。 2/1/2010 ICAL

GPU Experiment 預先使用SVD演算法將一張1024×1024的影 像分解成9個1024×1024的距陣。 設計演算法將前述的9個距陣透過乘法還原 原始影像,分別使用單一核心CPU、4核心 CPU、96核心GPU進行模擬。 2/1/2010 ICAL

Experiment Environment GPU Device NVIDA Geforce 9600 GSO Cores 96 Processor Clock 1375 MHz Standard Memory 384 MB Memory Bandwidth 38.4 GB/sec CPU Device Intel Core2 Quad Q9300 Cores 4 Processor Clock 2.5 GHz FSB speed 1333 MHz L2 Cache 6 MB 11/17/09

Experiment Results 2/1/2010 ICAL

Speedup VS. Single-Core Experiment Results Single-Core Multi-Core CUDA Speedup VS. Single-Core Speedup VS. Multi-Core Red 43.36 sec. 22.437 sec. 0.766 sec. 56.606 29.291 Green 44.046 sec. 25.312 sec. 0.562 sec. 78.374 45.039 Blue 44.219 sec. 26.64 sec. 78.681 47.402 Total (sec.) 131.625 sec. 74.389 sec. 1.89 sec. 71.220 40.577 2/1/2010 ICAL

Nvidia Tesla The Tesla GPU is a General Purpose GPU. The primary function of Tesla products are to aid in simulations, large scale calculations ,and image generation for professional and scientific fields,with the use of CUDA. 2/1/2010 ICAL

OpenMP with Tesla 一台單機系統可使用PCI-E x16插槽接PCI-E 橋接卡,透過橋接卡外接一台Tesla專用機 櫃,一個機櫃最多可插4張Tesla加速卡。 2/1/2010 ICAL

OpenMP with Tesla(續) 可使用多核心CPU搭配數張Tesla加速卡做 協同運算,但資料無法在不同的Tesla加速 卡之間做交換,因此必須在程式中預先指 定哪些資料要分給哪一張卡做處理。 當程式執行時用"用多核心程式來安排"每一 個CPU核心執行不同的任務(task),再由各 自核心去控制指定的GPU來進行資料(data) 加速。 例:4 cores CPU+4 Tesla,1 core控制1 Tesla 2/1/2010 ICAL

OpenMP with Tesla(續) 2/1/2010 ICAL

Conclusion 儘管使用多核心CPU可以增加資料處理的速度 ,但使用大量核心的GPU加速效果更為明顯, 可能為多核心CPU 的數十甚至數百倍。 使用GPU及多核心CPU可降低雲端運算主機在 大量資料處理上的負擔,擴充多核心CPU 及 GPU 單價較新購主機低廉許多,可有效降低成 本。 單機系統可用外接的方式使用多張Tesla加速卡 ,並使用多核心CPU搭配Tesla加速卡做協同運 算,由各別的CPU核心來控制Tesla加速卡,但 需要在事先做好資料分配規劃。 2/1/2010 ICAL