異質計算教學課程內容 「異質計算」種子教師研習營 洪士灝 國立台灣大學資訊工程學系

Slides:



Advertisements
Similar presentations
邢立宁 研究员 新兴信息技术条件下 智能优化的若干发展趋势 国防科学技术大学 信息系统与管理学院 2015年6月14日.
Advertisements

MMN Lab 未來教室與雲端化學習 Yueh-Min Huang Department of Engineering Science, National Cheng Kung University, Tainan, Taiwan
云计算辅助教学风云录 黎加厚 上海师范大学教育技术系 2010年8月9日.
第 2 章 中央處理單元.
第十章 產品訂價: 訂價的考量與策略.
DATE: 14/10/2009 陳威宇 格網技術組 雲端運算相關應用 (Based on Hadoop)
Big Data Ecosystem – Hadoop Distribution
Presentation of Big Data Issues
The Design and Implementation of a Wireless Healthcare Application for WSN- enabled IMS Environments Author: El Barachi, M.; Alfandi, O. Source: IEEE Consumer.
Java Programming Hygiene - for DIDC
加快数据中心运转速度 — 加速业务发展 约翰•福勒 甲骨文公司系统事业部执行副总裁. 加快数据中心运转速度 — 加速业务发展 约翰•福勒 甲骨文公司系统事业部执行副总裁.
如何在醫院中建構實證醫學研究環境 臺北醫學大學•市立萬芳醫院 張錦梅 組員
HADOOP的高能物理分析平台 孙功星 高能物理研究所/计算中心
虚拟机实时迁移技术 (Live Migration)
Introduction to MapReduce
Leftmost Longest Regular Expression Matching in Reconfigurable Logic
深層學習 暑期訓練 (2017).
Homework 4 an innovative design process model TEAM 7
An Adaptive Cross-Layer Multi-Path Routing Protocol for Urban VANET
TinyLink: A Holistic System for Rapid Development of IoT Applications
Xbox one计算机系统介绍 刘一帆.
軟體原型 (Software Prototyping)
高效能運算服務 (High Performance Computing) 建置之經驗分享
沈 彤 英特尔中国区嵌入式产品事业部 市场经理 Jul, 26th 2011
王耀聰 陳威宇 國家高速網路與計算中心(NCHC)
Introduction on Smartphone Platform
Proteus 可视化设计 Drag, Drop and PLAY! Slide 1.
人機介面 Arduino + Android 授課教師: 開課單位:.
从UNIX到Windows的 电信软件移植实践
Chapter 3 Case Studies.
Knowledge Engineering & Artificial Intelligence Lab (知識工程與人工智慧)
GPU分散式演算法設計與單機系統模擬(第二季)
單元3:軟體設計 3-2 順序圖(Sequence Diagrams)
Special English for Industrial Robot
CS 網路安全 Network Security
Android 课程讲义 智能手机开发
第6章 FPGA的下载配置电路设计.
华南理工大学 陈虎 博士 CUDA编程模型 华南理工大学 陈虎 博士
Data Mining 資料探勘 Introduction to Data Mining Min-Yuh Day 戴敏育
報告人:吳家麟教授 資訊網路與多媒體研究所 資訊工程學系暨研究所
971研究方法課程第九次上課 認識、理解及選擇一項適當的研究策略
Lecture on High Performance Processor Architecture (CS05162)
Programmable Logic Architecture Verilog HDL FPGA Design
Mobile Technologies for Library
服務於中國研究的網絡基礎設施 A Cyberinfrastructure for Historical China Studies
研究經驗與趨勢分享 黃悅民 Department of Engineering Science,
資料結構 Data Structures Fall 2006, 95學年第一學期 Instructor : 陳宗正.
学 术 报 告 北京化工大学化工资源有效利用国家重点实验室
器件模型、模拟是工艺和设计之间的桥梁 桥梁 半导体工艺 IC设计 评估/设计 纳米尺度下、新材料、新结构半导体器件 高效率 集约模型 准确
虚 拟 仪 器 virtual instrument
服務於中國研究的網絡基礎設施 A Cyberinfrastructure for Historical China Studies
SoC 與微控制器的發展 朱亞民.
汪卫 王轶彤 老逸夫楼602-3 数据库新技术 汪卫 王轶彤 老逸夫楼602-3.
核心能力 Core competence 什麼是核心能力? 2 如何訂定核心能力? 3 實例:亞利桑那大學 4 應考慮的關鍵問題 5
BiCuts: A fast packet classification algorithm using bit-level cutting
李宏毅專題 Track A, B, C 的時間、地點開學前通知
人機互動 Arduino + Android 授課教師: 開課單位:.
台灣未來學校 學校發展中心 (SDC) /主持人計劃.
11 Overview Cloud Computing 2012 NTHU. CS Che-Rung Lee
MultiThread Introduction
Operating System Software School of SCU
Chapter 7 作業基礎成本管理與 軟體工具之整合
ADX series Configuration
Usage Eclipse 敏捷方法工具介紹 實驗室網站:
LIU Lei Shanghai Center for Bioinformation Technology 03/05/2013
Experimental Analysis of Distributed Graph Systems
WiFi is a powerful sensing medium
2015年度中科院超级计算环境青岛分中心培训 中科院超算中心 中科院海洋所超算中心
中国科学院云南天文台博士毕业答辩 射电天文数据实时计算的关键技术研究 答辩人:戴伟 指导老师:王锋 学科专业: 天文技术与方法.
《神经网络与深度学习》 第10章 模型独立的学习方式
Presentation transcript:

異質計算教學課程內容 「異質計算」種子教師研習營 洪士灝 國立台灣大學資訊工程學系 2016-01-29 異質計算教學課程內容 「異質計算」種子教師研習營 洪士灝 國立台灣大學資訊工程學系 2016-01-29

現有的教學資源 HSA Tutorial Day 異質系統架構與應用 2015 異質計算系統國際研習課程

HSA Tutorial Day 全天七個導覽教學課程 簡報投影片、影片可下載 http://teaualune.github.io/hsa-tutorial-day/

異質系統架構與應用 Labs and final projects 台大資工系18周課程 課程內容 HSA Tutorial Day整天活動 https://ceiba.ntu.edu.tw/1032CSIE5314_HSAA 課程內容 HSA Tutorial Day整天活動 Introduction to Parallel Architectures Introduction to Parallel Programming GPU and GPGPU Programming OpenCL Programming by Example Virtual Platforms and Application Development Emulating HSA with HSAemu Reconfigurable Computing and Applications Optimizing Parallel Applications Invited speakers from industry Labs and final projects

2015 異質計算系統國際研習課程 邀請UT Texus的Vijay Janapa Redd和AMD的Paul Blinzer來給六場演講 http://www.cs.ccu.edu.tw/~cinfon/WorkshopSoCDesign/index.html

A New Book about HSA Edited by Wen-Mei Hwu (Dec. 2015)

該不該教HSA? 回頭看,去年教這門課是有點早,今年來教的話,因為資料比較齊全,而且有本可以做為教科書的課本,比較合適。 如果今年要教HSA的話,我的建議是,參考GPUOpen。

教學方法 需要看教學的目的決定教學方法: 初學者: 進階研究者: 學習者的程度 想解決的問題 簡單的 data parallel問題 基本的 GPU架構 較高階的語言(CUDA, AMP++) 進階研究者: 較複雜的irregular問題 進階的 GPU架構(HSA) 較低階的語言(OpenCL, HSA, Verilog)

期末專題和研究題目 異質計算是進階的課程, 進化極快 著重在於 實務上的重點: 分析應用的特性 思考各種異質架構的特性與優勢 上網蒐集最新資料和自學 實務上的重點: 效能分析工具的使用 應用程式的追蹤與效能分析 優化技術的使用

Example Works Done by Master Students Accelerating OpenCL-based Monte Carlo Medical Applications with GPU and FPGA (Bo-Yi Huang) Accelerating Accelerating Data Deduplication with Heterogeneous System Architecture (Yen-Po Wang) Virtual Hadoop: MapReduce over Docker Containers with an Auto-Scaling Mechanism for Heterogeneous Environments (Yi-Wei Chen) Accelerating SQL Database Applications with Heterogeneous System Architecture (Kuan-Ju Lin) Android Maleware Detection with Deep Learning (Wen-Ting Yeh)

Case Study - MCML MCML (Monte Carlo modeling of light transport in multi-layered tissues) Provided by University of Texas M.D. Anderson Cancer Center Based on visible light Multiple runs and layers A run includes different layers Each layer/tissue could set up the configuration To accelerate this time-consuming application, MCML was converted to OpenCL to run on GPU/FPGA Example : Five-layer skin model using an infinitely narrow beam at 633nm

GPU Acceleration for MCML Monte Carlo modeling of light transport in multi-layered tissues 2.67GHz Intel i7 4-core nVidia GTS 450 (192 cores) 5.4x 52x

FPGA Acceleration for MCML Altera Stratix V 21.3x

FPGA vs GPU for MCML FPGA offers better power-performance for the OpenCL code in this case study without coding in Verilog It is interesting to see how GPU/FPGA competes or compliment each other in the future To appear in FPGA 2016 Conference A Platform-Oblivious Approach for Heterogeneous Computing: a Case Study with Monte Carlo-based Radiation Simulation

Ongoing Works Performance methodologies and tools Accelerating System Characterization Optimization Process Design space exploration Open source system software Accelerating Big data appliances Machine learning algorithms Medial applications November 12, 2018November 12, 2018

Extra Thoughts For regular applications, use of GPU will be easier and more common Application development with open, easy-to-use API Use of optimized libraries/engines For irregular applications, entry barrier is still high Find ways to convert irregular applications to regular New and specialized system architecture Integrated CPU/GPU with shared memory November 12, 2018November 12, 2018

謝謝聆聽 Q&A