Course Information 課程資訊

Slides:



Advertisements
Similar presentations
第一组 Java 与云计算. Contents 云计算简介 一 二 云计算实例 三 云计算在教育中的应用 四.
Advertisements

13-1 人工智慧 13-2 雲端運算 13-3 感測網路與物聯網 13-4 生物資訊 13-5 計算機萬能嗎?
云计算辅助教学风云录 黎加厚 上海师范大学教育技术系 2010年8月9日.
云计算及安全 ——Cloud Computing & Cloud Security
北京工业云的实践与思考 曾宇 2010年10月.
职业教育网络学习空间建设的实践与思考 江苏省南京工程高等职业学校.
How to prepare yourself for the upcoming Cloud Era
雲端科技與智慧生活.
Building Your Private Cloud Rapidly using Open Source
DATE: 14/10/2009 陳威宇 格網技術組 雲端運算相關應用 (Based on Hadoop)
第五章 資訊科技基礎建設與新興科技.
云计算应用对比分析 李洁睿 周良俊 2017/3/8.
Business Model and Core Technologies of Cloud Computing
教育雲端科技的現況與未來發展 臺北市政府教育局聘任督學 韓長澤.
顏協邦 慧盟資訊 商業智慧導入服務部 資深經理
第二章 管理資訊系統概論暨資訊系統應用(Introduction to MIS and the Applications of IS)
VMWARE 大藍圖 SOFTWARE-DEFINED ENTERPRISE
思科Oracle RAC解决方案 Starry Wu UCS -GC.
云计算学习报告 报告人: 陈 霁 大规模数据处理软件Apache Hadoop.
The Trend of Cloud Computing
Network Storage and System Virtualization Technology
台灣雲端運算應用實驗中心研發計畫 計 畫 期 間:自98年7月1日至99年6月30日止 執行單位名稱 :財團法人資訊工業策進會 國立中山大學.
HADOOP的高能物理分析平台 孙功星 高能物理研究所/计算中心
海蔚蓝科技公司介绍.
大数据在医疗行业的应用.
2012/11/12 Virtual Machine.
Building Multi-user Hadoop Cluster using DRBL & Clonezilla
Certified OpenStack Administrator
本章學習目標 ERP系統的定義 企業應用軟體系統發展歷程 現階段ERP系統應用狀況.
當企鵝龍遇上小飛象 DRBL-Hadoop Jazz Wang Yao-Tsung Wang
Virtualization - the skill you need in Cloud Computing Era
高级软件工程 云计算 主讲:李祥 QQ: 年12月.
亞洲大學的數位學習資源與應用 鍾仁宗老師 101年12月4日.
3G时代的云计算 中国云计算专家委员会 刘鹏 中国网格: 中国云计算:
雲端運算??. 雲端運算簡介 王耀聰 陳威宇
Introduction to Cloud Computing Services and its Applications
Review Question 安裝 or 管理過 Windows Server? 安裝 or 管理過 Unix-like Server?
王耀聰 陳威宇 國家高速網路與計算中心(NCHC)
作業系統 補充: 雲端運算.
第一篇 Unix/Linux 操作介面 第 1 章 Unix/Linux 系統概論 第 2 章 開始使用 Unix/Linux
和諧社區資訊服務推廣計畫 -軟體雲端社區 資訊研習營
手機作業系統介紹.
朝雲端專業DBA邁進: 深入剖析 Windows Azure SQL Database 完整資料庫管理、雲端報表建立、建置分散式雲端資料庫
Working with Databases (II) 靜宜大學資管系 楊子青
开源云计算系统简介 电子工业出版社 刘鹏主编《云计算》教材配套课件11.
Cloud Computing(雲端運算) 技術的現況與應用
斯巴達帶大家上雲端.
崑山科技大學 曾 龍 資訊工程系系主任 數位生活研究所所長 雲端運算與資通安全研發中心主任
Why Cloud Computing Will Not Be Free Dave Durkee  Communications of the ACM, Vol. 53 No. 5, Pages 刁伯駒 涂崇智 指導教授:林娟娟 博士.
國立屏東高級工業職業學校 雲端網路及 雲端開系統介紹
CHAPTER 9 供應鏈管理系統.
OpenID與WordPress使用說明
連結資料庫管理系統.
云计算概述 云计算的概念与发展历程 体系结构 应用案例 优缺点分析 云计算前景 SI TEAM 孟茶
Unit 04 虛擬機器建構實驗 M. S. Jian Department of Computer Science and Information Engineering National Formosa University Yunlin, Taiwan, ROC.
软件工程基础 云计算概论 刘 驰.
第二章 資訊管理的科技觀點.
Real-Time System Software Group Lab 408 Wireless Networking and Embedded Systems Laboratory Virtualization, Parallelization, Service 實驗室主要是以系統軟體設計為主,
講師:陳永芳 網際網路資源運用 講師:陳永芳
Unit 05 雲端分散式Hadoop實驗 -I M. S. Jian
2011清大電資院學士班 「頂尖企業暑期實習」 經驗分享心得報告 實習企業:工研院 實習學生:電資院學士班 楊博旭.
雲端運算的基石(1) 虛擬化技術簡介
SAP 架構及前端軟體安裝 Logical View of the SAP System SAP Frontend 7.1安裝與登入
資訊網路專題 Special Topics on Information Networks
Enterprise Resource Planning System 企業資源規劃系統
Cloud Operating System - Unit 03: 雲端平台建構實驗
第 18 章 雲端計算.
11 Overview Cloud Computing 2012 NTHU. CS Che-Rung Lee
Introduction to Cloud Computing Services and its Applications
Introduction to Mobile Computing
Presentation transcript:

Course Information 課程資訊 講師介紹: 國網中心 王耀聰 副研究員/交大電控碩士 jazz@nchc.org.tw 所有投影片、參考資料與操作步驟均在網路上 由於雲端資訊變動太快,愛護地球,請減少不必要之講義列印。 礙於缺乏實機操作環境,故以影片展示與單機操作為主 若有興趣實機操作,請參考國網中心雲端運算課程錄影 http://trac.nchc.org.tw/cloud http://www.classcloud.org/media http://www.screentoaster.com/user?username=jazzwang 若需要實驗環境,可至國網中心雲端運算實驗叢集申請帳號 http://hadoop.nchc.org.tw Hadoop相關問題討論: http://forum.hadoop.tw

The trend of Cloud Computing and How should public sectors adjust 淺談雲端運算的新趨勢 及其對政府部門之衝擊與因應對策 The trend of Cloud Computing and How should public sectors adjust Jazz Wang Yao-Tsung Wang jazz@nchc.org.tw

What is Cloud Computing? 何謂雲端運算?請用一句話說明! Anytime 隨時 More definition? 其他定義請參考:NIST Notional Definition of Cloud Computing Anywhere 隨地 With Any Devices 使用任何裝置 Accessing Services 存取各種服務 Cloud Computing =~ Network Computing 雲端運算 =~ 網路運算

1. On-demand self-service. National Definition of Cloud Computing 美國國家標準局NIST給雲端運算所下的定義 3 Service Models 三個服務模式 4 Deployment Models 四個佈署模型 5 Characteristics 五大基礎特徵 1. On-demand self-service. 隨需自助服務 2. Broad network access 隨時隨地用任何網路裝置存取 3. Resource pooling 多人共享資源池 4. Rapid elasticity 快速重新佈署靈活度 5. Measured Service 可被監控與量測的服務

3 Service Models of Cloud Computing 雲端運算的三種服務模式 SaaS Software as a Service 軟體即服務 PaaS Platform as a Service 平台即服務 IaaS Infrastructure as a Service 架構即服務

Everything as a Service 啥米鬼都是一種服務 AaaS Architecture as a Service BaaS Business as a Service CaaS Computing as a Service DaaS Data as a Service DBaaS Database as a Service EaaS Ethernet as a Service FaaS Frameworks as a Service GaaS Globalization or Governance as a Service HaaS Hardware as a Service IMaaS Information as a Service IaaS Infrastructure or Integration as a Service IDaaS Identity as a Service LaaS Lending as a Service MaaS Mashups as a Service OaaS Organization or Operations as a Service SaaS Software or Storage as a Service PaaS Platform as a Service TaaS Technology or Testing as a Service VaaS Voice as a Service Customer-Oriented 客戶導向 引用自: https://www.ibm.com/developerworks/mydeveloperworks/blogs/sbose/entry/gathering_clouds_of_xaas

雲端運算的四種佈署模型 4 Deployment Models of Cloud Computing Public Cloud 公用雲端 Target Market is S.M.B. 主要客戶為 中小企業 Dynamic Resource Provisioning between public and private cloud 私有雲端動態根據計算需求 調用公用雲端的資源 以大型企業 為主要客戶 Enterprise is key market 私有雲端 Private Cloud Hybrid Cloud Community Cloud 社群雲端 Academia 學術為主

Evolution of Cloud Services 雲端服務只是軟體演化史的必然趨勢 數位化 實體 單機版 個人使用 網路版 多人共享 行動版 隨時存取 Mobile Mail Web Mail E-Mail 信箱 Mobile TV Web TV 電視盒 電視 M-Office Google Docs Office 打字機 Flash Wengo Skype 數位電話 電話 微網誌 部落格 電子佈告欄 佈告欄

Rome wasn't built in a day ! 羅馬不是一天造成的! 圖片來源:http://www.mjjq.com/pic/20070822/20070822234234402.jpg When did the Cloud come ?! 這朵雲幾時飄過來的?!

Brief History of Computing (1/5) 1960 PDP-1 . 1965 PDP-7 1969 1st Unix Source: http://pinedakrch.files.wordpress.com/2007/07/ Mainframe Super Computer

1977 Apple II 1981 IBM 1st PC 5150 Back to Year 1970s ...

1982 TCP/IP 1983 GNU 1991 Linux Back to Year 1980s ...

Brief History of Computing (2/5) Source: http://www.nchc.org.tw Mainframe Super Computer PC / Linux Cluster Parallel

Back to Year 1990s ... 1990 World Wide Web 1991 CORBA ... by CERN … 1993 Web Browser Mosaic by NCSA 1991 CORBA ... Java RMI Microsoft DCOM Distributed Objects Back to Year 1990s ...

Brief History of Computing (3/5) Source: http://www.scei.co.jp/folding/en/dc.html Mainframe Super Computer PC / Linux Cluster Parallel Internet Distributed Computing

Back to Year 2000s ... 1997 Volunteer Computing 1999 SETI@HOME 2003 Globus Toolkit 2 2002 Berkley BOINC 2004 EGEE gLite Back to Year 2000s ...

Brief History of Computing (4/5) Source: http://gridcafe.web.cern.ch/gridcafe/whatisgrid/whatis.html Mainframe Super Computer PC / Linux Cluster Parallel Internet Distributed Computing Virtual Org. Grid Computing

Back to Year 2007 ... 2001 Autonomic Computing IBM 2006 Apache Hadoop 2005 Utility Computing Amazon EC2 / S3 2007 Cloud Computing Google + IBM Back to Year 2007 ...

2007 Data Explore Top 1 : Human Genomics – 7000 PB / Year Top 2 : Digital Photos – 1000 PB+/ Year Top 3 : E-mail (no Spam) – 300 PB+ / Year Source: http://www.emc.com/collateral/analyst-reports/expanding-digital-idc-white-paper.pdf Source: http://lib.stanford.edu/files/see_pasig_dic.pdf

Brief History of Computing (5/5) Source: http://mmdays.com/2008/02/14/cloud-computing/ Mainframe Super Computer PC / Linux Cluster Parallel Internet Distributed Computing Virtual Org. Grid Computing Data Explode Cloud Computing

在這漫長的演化中,我們到底學到些什麼?! What can we learn from the past ?! Source: http://cyberpingui.free.fr/humour/evolution-white.jpg

教訓二:格網運算該用在異業結盟的資源共享! Lesson #1: One cluster can't fit all ! 教訓一:叢集的單一設定無法滿足所有需求! Answer #1: Virtual Cluster 新服務:虛擬化叢集 Lesson #2: Grid for Heterogeneous Enterprise ! 教訓二:格網運算該用在異業結盟的資源共享! Answer #2: Peak Usage Time 尖峰用量發生時間點 Answer #3: Total Cost of Ownership 總擁有成本 Lesson #3: Extra cost to move data to Grid ! 教訓三:資料搬運的網路與時間成本! This is why Cloud Computing matters ?! 這就是為什麼雲端運算變得熱門?!

趨勢一:資料開始回歸集中管理 如何儲存大量資料呢?! Trend #1: Data are moving to the Cloud Access data anywhere anytime 為了隨時存取 Reduce the risk of data lost 降低資料遺失風險 Reduce data transfer cost 減少資料傳輸成本 Enhance team collaboration 促進團隊協同合作 How to store huge data ?! 如何儲存大量資料呢?!

Open Implementation 實作不受壟斷 Trend #2: Web become default Platform! 趨勢二:網頁變成預設開發平台 Open Standard 網頁是開放標準 Open Implementation 實作不受壟斷 Cross Platform 瀏覽器成為跨平台載具 Web Application 網頁程式設計成為顯學 Browser difference become entry barrier ?! 瀏覽器的差異造成新的技術門檻?!

Parallel Computing 平行運算的技能 Trend #3: HPC become a new industry 趨勢三:高速計算已悄悄變成新興產業 Parallel Computing 平行運算的技能 Distributed Computing 分散運算的技能 Multi-Core Programming 多核心程式設計 Processing Big Data 處理大資料的技能 Education and Training are needed !! 為了讓這些技能與產業接軌,亟需教育訓練!!

該使用別人打造的雲端,還是自己打造專屬雲端呢? Flying to the Cloud ... or Falling to the Ground ... Source: http://media.photobucket.com/image/falling%20ground/preeto_f10/falling.jpg 該使用別人打造的雲端,還是自己打造專屬雲端呢?

Let's Talk about Public Cloud 讓我們先來談談公用雲端服務 Public Cloud 公用雲端 Target Market is S.M.B. 主要客戶為 中小企業 以大型企業 為主要客戶 Enterprise is key market 私有雲端 Private Cloud Hybrid Cloud Community Cloud 社群雲端 Academia 學術為主

Public Cloud #1: Amazon 亞馬遜網路書店 Amazon Web Service ( AWS ) 虛擬伺服器:Amazon EC2 - Small (Default) $0.085 per hour(L) - $0.12 per hour(W) - All Data Transfer $0.15 per GB 儲存服務:Amazon S3 - $0.15 per GB – first 50 TB / month of storage used - $0.15 per GB – all data transfer in - $0.01 per 1,000 PUT, COPY, POST, or LIST requests 觀念:Paying for What You Use 參考來源:http://eblog.cisanet.org.tw/post/Cloud-Computing.aspx      http://aws.amazon.com/ec2/pricing/      http://aws.typepad.com/aws/2010/02/aws-data-transfer-prices-reduced.html      http://aws.amazon.com/s3/#pricing

Public Cloud #2: Google 谷歌 • Google App Engine (GAE) •讓開發者可自行建立網路應用程式於 Google 平台之上。 •提供:  - 500MB of storage  - up to 5 million page views a month  - 10 applications per developer account •限制:  - 程式設計語言只能用 Python 或 Java 計費標準: 連出頻寬 $0.12 美元/GB, 連入頻寬 $0.10 美元/GB CPU 時間 $0.10 美元/時 儲存的資料 $0.15 美元/GB-每月 電子郵件收件者 $0.0001 美元/每個收件者 參考來源:http://code.google.com/intl/zh-TW/appengine/      http://code.google.com/intl/zh-TW/appengine/docs/billing.html

Public Cloud #3: Microsoft 微軟 Microsoft Azure 是一套雲端服務作業系統。 作為 Azure 服務平台的開發、服務代管及服務管理環境。 服務種類: .Net services SQL services Live services 參考來源:http://tech.cipper.com/index.php/archives/332

Public Cloud #3: Microsoft 微軟 Dallas → DaaS Azure AppFabric → PaaS (類似GAE) SQL Azure → PaaS (雲端SQL) Window Azure → PaaS (類似EC2) Hyper-V → IaaS (虛擬化) 參考來源:微軟雲端運算的策略與產品藍圖,台灣微軟李匡正,2010-02-24

Public Cloud Comparison: 公用雲端的比較 參考來源:微軟雲端運算的策略與產品藍圖,台灣微軟李匡正,2010-02-24

How can we build our Private Cloud ?? 那我們如何打造私有雲端呢?? Public Cloud 公用雲端 Target Market is S.M.B. 主要客戶為 中小企業 以大型企業 為主要客戶 Enterprise is key market 私有雲端 Private Cloud Hybrid Cloud Community Cloud 社群雲端 Academia 學術為主

Web 2.0 介面, Mashups, Workflows, … Reference Cloud Architecture 雲端運算的參考架構 User-Level Middleware Core Middleware User-Level System Level IaaS PaaS SaaS 虛擬化 VM, VM management and Deployment 控制 Qos Neqotiation, Ddmission Control, Pricing, SLA Management, Metering… 程式語言 Web 2.0 介面, Mashups, Workflows, … 應用 Social Computing, Enterprise, ISV,…

Web 2.0 介面, Mashups, Workflows, … Open Source for Private Cloud 建構私有雲端運算架構的自由軟體 虛擬化 VM, VM management and Deployment 控制 Qos Neqotiation, Ddmission Control, Pricing, SLA Management, Metering… 程式語言 Web 2.0 介面, Mashups, Workflows, … 應用 Social Computing, Enterprise, ISV,… Xen, KVM, VirtualBox, QEMU, OpenVZ, ... OpenNebula, Enomaly, Eucalyptus , OpenQRM, ... Hadoop (MapReduce), Sector/Sphere, AppScale eyeOS, Nutch, ICAS, X-RIME, ...

Open Cloud #1: Eucalyptus http://open.eucalyptus.com/ 原是加州大學聖塔芭芭拉分校(UCSB)的研究專案 目前已轉由Eucalyptus System這間公司負責維護 創立目的是讓使用者可以打造自己的EC2 特色是相容於 Amazon EC2 既有的用戶端介面 優勢是Ubuntu 9.04 已經收錄 Eucalyptus 的套件 Ubuntu Enterprise Cloud powered by Eucalyptus in 9.04 目前有提供 Eucalyptus 的官方測試平台供註冊帳號 缺點:目前仍有部分操作需透過指令模式 關於 Eucalyptus 的更多資訊,請參考 http://trac.nchc.org.tw/grid/wiki/Eucalyptus

Open Cloud #2: OpenNebula http://www.opennebula.org 由歐洲研究學會(European Union FP7 )贊助 將實體叢集轉換成具管理彈性的虛擬基礎設備 可管理虛擬叢集的狀態、排程、遷徙(migration) 優勢是Ubuntu 9.04 已經收錄 OpenNebula 的套件 缺點:需下指令來進行虛擬機器的遷徙(migration)。 關於 OpenNebula 的更多資訊,請參考http://trac.nchc.org.tw/grid/wiki/OpenNEbula

Open Cloud #3: Hadoop 目前主要由 Yahoo! 資助、開發與運用 http://hadoop.apache.org Hadoop 是 Apache Top Level 開發專案 目前主要由 Yahoo! 資助、開發與運用 創始者是Doug Cutting,參考Google Filesystem,以 Java開發,提供HDFS與MapReduce API。 2006年使用在Yahoo內部服務中 已佈署於上千個節點。 處理Petabyte等級資料量。 Facebook、Last.fm、Joost … 等 著名網路服務均有採用Hadoop。

Open Cloud #4: Sector / Sphere http://sector.sourceforge.net/ 由美國資料探勘中心(National Center for Data Mining)研發 的自由軟體專案。 採用C/C++語言撰寫,因此效能較 Hadoop 更好。 提供「類似」Google File System與MapReduce的機制 基於UDT高效率網路協定來加速資料傳輸效率 Open Cloud Consortium的Open Cloud Testbed,有提供測 試環境,並開發了MalStone效能評比軟體。

What we learn today ? 隨時隨地用任何裝置存取各種服務!! 資料集中、虛擬化、異業資源共享 採用自由軟體也能打造私有雲端 雲端運算是2007年繼格網運算之後的新趨勢!! Cloud Computing become new trend since year 2007 !! 亞馬遜、谷歌、微軟等! 什麼都可以是服務 ~ Amazon, Google, Microsoft and more! Everything as a Service! 隨時隨地用任何裝置存取各種服務!! Accessing services with any device anytime anywhere!! 採用自由軟體也能打造私有雲端 Hadoop, Sectore/Sphere, Eucalyptus, and more .... 資料集中、虛擬化、異業資源共享 Data-intensive, Virtualization, Heterogeneous WHO WHEN WHY HOW

What is the Impacts and How should public sectore adjust ? 雲端運算對政府部門之衝擊與因應對策 What is the Impacts and How should public sectore adjust ? Jazz Wang Yao-Tsung Wang jazz@nchc.org.tw

衝擊一:資訊基礎建設預算刪減! 衝擊二:加速跨單位資訊整合與協同合作! 衝擊三:單一政府服務存取窗口! Impact #1: IT Budget CUT ! 衝擊一:資訊基礎建設預算刪減! Adjust #1: Virtualization 評估導入虛擬化技術 Impact #2: More Collaboration and Intergration ! 衝擊二:加速跨單位資訊整合與協同合作! Adjust #2: Share Public Data 共享公用資料 Adjust #3: Single AAA mechanism 統一身分認證 Impact #3: Need Single Service Gateway ! 衝擊三:單一政府服務存取窗口!

公部門導入雲端參考策略(1) Virtualization Adjust #1: Virtualization 公部門導入雲端參考策略(1) Virtualization 導入虛擬化的效益高於雲端運算 導入評量指標: 總硬體使用率(100% CPU使用?) 總電源開銷、空調、管理人力 商業解決方案: VMWare ESXi / vSphere Microsoft Hyper-V Citrix XenServer 預期效益: 減少伺服器採購成本與營運成本 (Server Consolidation) 增加管理彈性與災害復原機制 (Ex. 異常斷電造成的服務修復)

How to Evaluate the need of Virtualization ? 如何評估對虛擬化的需求?? 關鍵驅動因素 預算刪減?節約能源?提高現有硬體使用率? 導入評估工具 Microsoft Assessment and Planning (MAP) Toolkit for Hyper-V Hyper-V 評估工具: 收集 Server 使用情況,產生評估報告等 Open Source: MRTG, Gangalia, Nagios, .... 蒐集CPU用量、記憶體用量、尖峰負載發生時間、批次排程時間 隱含額外成本 若想獲得虛擬化帶來的好處(災害復原與動態負載平衡),需要 額外建置共享的儲存設施。

Thin Client and VDI for next IT procurement ? 下次改採購精簡型電腦與桌面虛擬化?? 桌面虛擬化的需求越來越高?? 導入評量指標: 總電源開銷、空調、管理人力 既存共用儲存設施 資料機敏性高,不容外洩 商業解決方案: VMWare Viewer 4 Microsoft Hyper-V Citrix XenDesktop 預期效益: 降低電力損耗(需評估) 減少資料外洩(搭配資安政策) Source:http://www.vmware.com/files_inline/images/vdi_diagram_new_01.gif

用綠色自由軟體 打造綠色工廠 GREEN OSS GREEN FACTORY Another alternative of Virtualization 虛擬化番外篇:改用Terminal +無碟架構 用綠色自由軟體 GREEN OSS 打造綠色工廠 GREEN FACTORY 關於企鵝龍(DRBL)在金屬加工業的節能案例分享,請參考 http://trac.nchc.org.tw/cloud/attachment/wiki/jazz/09-10-14/TSMC/08-08-17_DRBL_Green_Computing_v2.pdf

修改理念=減少不必要的開支與能源消耗 降低硬體建置開支 不用200W的桌上型電腦(有風扇→易故障) 不裝硬碟(少一個零件也可減少用電) 降低軟體授權開支 購買Windows作業系統與Office授權只為了相當簡單的報工作業並不划算 改用Terminal遠端桌面連線模式 降低MIS系統管理人員負擔 故障時直接拿備品精簡電腦替換→免安裝設定

新舊架構成本比較(總建置成本/年度營運成本) 節省50萬 總建置成本 省17萬硬體 省33萬軟體 節省22萬 年度營運成本 省 3萬電費(60%) 省19萬工資(57%)

若無很高的檔案讀寫需求,多善用RAM Disk, 企鵝龍(DRBL)無碟架構不僅省電最高達33%,效能還比較好 Saves 33.33% 關於企鵝龍與再生龍的更多資訊,請參考 http://drbl.nchc.org.tw , http://clonezilla.nchc.org.tw 關於 E2CC 的更多資訊,請參考 http://trac.nchc.org.tw/grid/raw-attachment/wiki/deliverable09/1003anav.pdf

Adjust #2: Share Public Data 公部門導入雲端參考策略(2) 共用公開資料

Adjust #2: Share Public Data 公部門導入雲端參考策略(2) 共用公開資料 資料整合為跨單位整合的第一步!! 導入評量指標: 資料所有權/散佈權/重覆比例 資料成長量= ?? PB/Year 現有資料副本個數/災害復原能力 商業硬體方案:EMC、NetApp 商業軟體方案:IBM GPFS 自由軟體方案: Lustre、ZFS、GlusterFS... 預期效益: 減少資料重覆(Data Deduplication) 提供異地副本備份、災害復原機制

公部門導入雲端參考策略(3) 單一身分認證 Adjust #3: Single AAA Service Authencation, Authorization, Accounting as a Service

Adjust #3: Single AAA Service 公部門導入雲端參考策略(3) 單一身分認證 跨單位痛苦的第二步:身分認證!! 目前已經在作: 我的e政府-政府e化服務索引入口 自然人憑證-實體身分認證媒介 導入評量指標: 對外服務種類與個數 民眾可能需要隨時取得的資訊 自由軟體方案: OpenID 預期效益: 減少資料重覆(Data Deduplication) 提供異地副本備份、災害復原機制

Advice #1: There are other browsers !! 個人建言(1) 還有很多IE以外的瀏覽器!!

Advice #2: Ask for support of Multicore !! 個人建言(2) 軟體採購請要求多核心支援!!

Enterprise Applications of Private Cloud 私有雲端技術之產業應用 Enterprise Applications of Private Cloud Jazz Wang Yao-Tsung Wang jazz@nchc.org.tw

Cyberinfrastructure of TSMC 台積電的資訊架構 @ Year 2000 ? 後端資訊系統 ( internal operation ) 前端資訊系統 eFoundry PIDB 產品資訊資料庫 Product Information Data-Base FPS 預測規劃系統 Forecast Planning System TSMC-Direct Logistics 商業流共享 Engineering 晶圓製造良率 Design 晶片設計資訊 TOM 全方位訂單管理系統 Total Order Management (資訊流) TSMC-Online 1.0 / 2.0 TSMC-YES MES 製造執行管理系統 Manufacturing Execution System (物流) Internet Layout Viewer CRP VMI JIT SAP ERP 企業資源規劃 Enterprise Resource Planning (金流) Design Sphere Access 以上資訊;參考 2000 年電子時報針對台積電所作之個案研究。

虛擬桌面 VDI 網頁平台 WebOS 虛擬化 大型檔案 平行運算 分散資料庫

? Possible Cloud Service for TSMC (1) 台積電雲端導入參考策略(1) Grid WebOS 導入前: https://service.nchc.org.tw/crs/GridComputing/GridComputing.php Internet Layout Viewer 導入前: 每間小公司都需要採購專用軟體 商業軟體授權金額高 導入評量指標: 總軟體使用率(時間、人次) 導入需求技術: 權限控管、授權分配(排程)機制 使用率統計 → 成本攤提比例 預期效益: 上下游供應鏈共同分攤軟體授權 協同驗證設計與製程可行性 Design Sphere Access ? Ex.讓協力廠商遠端執行Cadence

Possible Cloud Service for TSMC (2) 台積電雲端導入參考策略(2) Virtualization 導入虛擬化的效益高於雲端運算 導入評量指標: 總硬體使用率(100% CPU使用?) 總電源開銷、空調、管理人力 商業解決方案: VMWare ESXi / vSphere Microsoft Hyper-V Citrix XenServer 預期效益: 減少伺服器採購成本與營運成本 (Server Consolidation) 增加管理彈性與災害復原機制 (Ex. 異常斷電造成的服務修復)

Possible Cloud Service for TSMC (3) 台積電雲端導入參考策略(3) Skills for Big Data 處理海量資料是雲端運算的精華 用前處理與資料量換取查詢時間 關鍵技術: 分散儲存檔案 → 在地平行運算 分散式資料庫 → Key-Value 商業解決方案: Google App Engine GFS / MapReduce / BigTable Amazon S3 / SimpleDB Cloudera Hadoop Distribution 預期效益: 降低檔案遺失風險 降低資料傳輸成本

About NCHC Cloud Computing Research Group ... 工商服務時間 * @_@ * About NCHC Cloud Computing Research Group ... Jazz Wang Yao-Tsung Wang jazz@nchc.org.tw

NCHC Cloud Computing Research Group 團隊小檔案:國網中心雲端運算研究小組 主要研究雲端運算的基礎架構組成元件 團隊成員:6名 王耀聰–drbl-xen / drbl-hadoop (~6 Years)     架構 陳威宇–Hadoop / NutchEz / ICAS (~3 Years)   應用 郭文傑–Xen / OpenNebula / Eucalyptus (~3 Years) 元件 涂哲源–Xen GPU / OpenMP / VirtualGL (~3 Years) 元件 鄭宗碩–Google App Engine (~2 Years)      新技術 鄧偉華–AMQP / OpenID (~2 Years)       新技術 定位: 研發快速佈建軟體,提供實驗平台服務,開辦訓練課程育才 獨特性: 基於企鵝龍(DRBL),可快速佈署雲端運算的叢集環境

站在巨人的肩膀-國網中心自由軟體開發 多元化資訊教學的新選擇! 企鵝龍DRBL 再生龍Clonezilla 以個人叢集電腦(PC Cluster)經驗發展DRBL&Clonezilla 企鵝龍DRBL 再生龍Clonezilla (Diskless Remote Boot in Linux ) 適合將整個電腦教室轉換 成純自由軟體環境 適用完整系統備份、裸機 還原或災難復原 是自由!不是免費… 分送、修改、存取、使用軟體的自由。免費是附加價值。

何謂企鵝龍DRBL ?? = + + Server Diskless Remote Boot in Linux Diskfull PC 網路是便宜的,人的時間才是昂貴的。 企鵝龍簡單來說就是..... 用網路線取代硬碟排線 所有學生的電腦都透過網路連接到一台伺服器主機 Diskfull PC = + + Diskless PC Server source: http://www.mren.com.tw

何謂再生龍Clonezilla ?? Clone (複製) + zilla = Clonezilla (再生龍) 裸機備分還原工具 Norton Ghost 的自由軟體版替代方案 Disk to Disk Disk to Image Image to N Disks

(IDS-log Cloud Analysis System,ICAS) 軟體研發(1):雲端入侵偵測分析系統 (IDS-log Cloud Analysis System,ICAS) 持續開發中,待整理套件 結合Hadoop與HBase來處裡SNORT產生的網路入侵報告。 雲端運算處理資料格式相似且資料量大的情況下,能展現其效益,並提 供高容錯率、低獨占系統資源、多工作同時執行等能力 Key-Value資料庫寫入慢,讀取效能相對快,但缺乏其他語言支援。 關聯式資料庫對小量資料的讀寫的效率較好,且支援的語言也較多。

軟體研發(2):簡易架設個人搜尋引擎(NutchEz) 已釋出中文版套件 http://trac.nchc.org.tw/cloud/wiki/NutchEz 合適用來建立屬於組織內部的網頁搜尋引擎 核心為強大的Nutch,建於Hadoop 上,貢獻:簡化安裝步驟 效能數據:搜尋699 doc, 322 pdf, 9 ppt, 13 odt.費時11 分 系統負載:CPU Quad 4 2.4G (19%)/ 4GB RAM (20%)

軟體研發(3):用企鵝龍佈署Hadoop雲端實驗環境 持續開發中,待整理套件 drbl-hadoop – 掛載本機硬碟給 HDFS 用 svn co http://trac.nchc.org.tw/pub/grid/drbl-hadoop hadoop-register – 註冊網站與ssh applet svn co http://trac.nchc.org.tw/pub/cloud/hadoop-register

實驗服務:hadoop.nchc.org.tw多人雲端實驗叢集 DRBL Server - 1台(hadoop),加大/home與/tftpboot空間。 DRBL Client - 19台(hadoop101~hadoop119) 使用Cloudera的Debian套件,並針對多人環境進行讀寫權限加強。 使用drbl-hadoop 的設定跟init.d script來協助部署 使用hadoop-register 來提供使用者註冊與ssh applet介面

人才培育:雲端運算基礎課程(一~三)開放課程 雲端運算基礎課程(一):Hadoop簡介、安裝與實作 雲端運算基礎課程(二):Xen 虛擬化叢集建置、管理與應用 雲端運算基礎課程(三):Google App Engine體驗課程 最新課程訊息與課程錄影詳見http://trac.nchc.org.tw/cloud/

對學界的幫助(1):實驗叢集間接促成研究成果 促成台大資工系資訊網路與多媒體研究所發表論文至 ACM Multimedia 2009 自2009年四月至2009年九月,雲端實驗叢集共註冊238人,服務37個學術單位(計 154人),、5個研究單位(計21人)、19間業界公司(計20人)、2所醫院(計3人)及不願 提供單位的一般民眾計30人。累計於五個月內執行3341個Job。 註冊人數排行前五大依序為交通大學、台灣大學、成功大學、中央大學與陽明大學

對學界的幫助(2):發展用企鵝龍佈署生物叢集的工具 持續整理中,待整理套件 drbl-biocluster – 彙整安裝多人共用生物資訊叢集的批次檔 svn co http://trac.nchc.org.tw/pub/grid/drbl-biocluster 簡化安裝與測試生物資訊叢集常用軟體的程序:DRBL、MPICH2、R、Rmpi、 BioCondoctor、Ganglia 、Nagios、AutoFACT、BLAST、SIM4、Clustal、 PipMaker、Phylip、Eland、Velvet、Bowtie、SOAP 成果:http://bio2.classcloud.org

對學界的幫助(3):更多開放教材-生物叢集、GAE... 陽明生資所97年度暑期學分班 格網及平行運算(實驗課程) http://trac.nchc.org.tw/course/ 陽明生資所98年度暑期學分班 格網及平行運算(實驗課程) http://bio.classcloud.org 雲端運算基礎課程(一) Hadoop簡介、安裝與範例實作  http://www.classcloud.org/media/ 「Ruby on Rails 初學」電子書 by 鄭立竺 http://nchcrails.blogspot.com Google App Engine 電子書 by 鄭宗碩 http://nchc-gae.blogspot.com/ More to come ......

Slides - http://trac.nchc.org.tw/cloud Questions? Slides - http://trac.nchc.org.tw/cloud Jazz Wang Yao-Tsung Wang jazz@nchc.org.tw