當企鵝龍遇上小飛象DRBL-Hadoop當企鵝龍遇上小飛象DRBL-Hadoop Jazz Wang Yao-Tsung Wang Jazz Wang Yao-Tsung Wang

Slides:



Advertisements
Similar presentations
南投縣教育網路專案 建置說明 2016/7/11 D-Link Taiwan 台中技術支援課 工程師 林俊佑 #23 Version 1.03.
Advertisements

Linux 安裝入門與基本管理 課程目標: 學習Linux平台下的安裝設定 與 建置一個基本的Linux伺服器
辅导老师:隋秀峰 2008年10月22日 Lab3:MPI Programming 辅导老师:隋秀峰 2008年10月22日.
高速運算於生物資訊之應用 HPC for Bioinformatics 高速運算於生物資訊之應用 Jazz Wang Yao-Tsung Wang Jazz Wang Yao-Tsung Wang
Bomgar Remote Support 最安全的遠端資訊服務系統平台
DATE: 14/10/2009 陳威宇 格網技術組 雲端運算相關應用 (Based on Hadoop)
Big Data Ecosystem – Hadoop Distribution
Haduzilla - Building hadoop cluster with Debian preseed 黑肚龍:無人值守自動安裝 Hadoop 叢集 Haduzilla - Building hadoop cluster with Debian preseed 黑肚龍:無人值守自動安裝 Hadoop.
實驗 9: 無線安全網路之建設.
教育雲端科技的現況與未來發展 臺北市政府教育局聘任督學 韓長澤.
集群作业管理系统简介 报告人:罗正平 导 师:肖炳甲研究员.
红旗Linux认证培训 课程介绍.
Cobbler+RDO= Openstack
share box user research finding
台灣雲端運算應用實驗中心研發計畫 計 畫 期 間:自98年7月1日至99年6月30日止 執行單位名稱 :財團法人資訊工業策進會 國立中山大學.
操作系统结构.
HADOOP的高能物理分析平台 孙功星 高能物理研究所/计算中心
Linux 入門課程(介紹篇) 講者: Pank
UNIX系統與資料庫安裝 Why UNIX 常用的工具程式介紹 資料庫的安裝.
寻找适合您的工业4.0 Dell/曾峰.
Subversion (SVN) Presented by 李明璋 R /2/21
大数据在医疗行业的应用.
宽带路由器配置与应用.
网络地址转换(NAT) 及其实现.
Introduction to MapReduce
Building Multi-user Hadoop Cluster using DRBL & Clonezilla
當企鵝龍遇上小飛象 DRBL-Hadoop Jazz Wang Yao-Tsung Wang
YARN & MapReduce 2.0 Boyu Diao
作業系統的結構 日期 : 2018/9/17.
CJLR PDM&SRM 单点登录指南 场景一:在CJLR公司网络中(CJLR办公室/由VPN拨入),使用CJLR公司电脑登录:
Linux.
佐登妮斯大樓監控系統簡介 圓 泰 科 技 1.
高效能運算服務 (High Performance Computing) 建置之經驗分享
ARUBA 無線網路教育訓練.
王耀聰 陳威宇 國家高速網路與計算中心(NCHC)
6.2.
實現雲端運算 Hadoop HDFS 磁碟及記憶體之即時分級服務
Linux 圖形操作介面 GUI -- X-window 與 Webmin
Linux 系統管理 計網中心網路組 楊世偉.
CHAPTER 6 認識MapReduce.
讲议: PXE 介绍及实现 Jarvis
CDR - Continuous Data Replication
網路資源的建立--LINUX系統 國立東華大學電算中心 陳鴻彬.
第3章 Linux免安裝版學習與操作 課前指引
SAP 架構及基本操作 SAP前端軟體安裝與登入 Logical View of the SAP System SAP登入 IDES
GHOST 架構示意圖 Client端OS,目前ghost 支援 9x,me,2000,xp ,及支援wol
第7單元 網路和資料通訊 McGraw-Hill Education.
Windows與Linux資源共享 SAMBA
「寬頻匯流網路管理」教材 模組四: 第一章 網路管理架構
第5單元 實習1 ilon10 setup.
第二章 防火墙基础技术.
2010電資院 「頂尖企業暑期實習」 經驗分享心得報告
凌宁 系统工程师 亚洲区嵌入式系统事业群 微软(中国)有限公司
服務於中國研究的網絡基礎設施 A Cyberinfrastructure for Historical China Studies
還原系統文獻發想 資 訊 傳 播 系 專 題 研 究 班 級: 資傳三A 組 員: 陳星宇 、 林佳辰 、 邱鈺翔 1.
SAP R/3架構及前端軟體安裝 Logical View of the R/3 System SAP Frontend 6.2安裝
Real-Time System Software Group Lab 408 Wireless Networking and Embedded Systems Laboratory Virtualization, Parallelization, Service 實驗室主要是以系統軟體設計為主,
Unit 05 雲端分散式Hadoop實驗 -I M. S. Jian
中国科学技术大学计算机系 陈香兰 2013Fall 第七讲 存储器管理 中国科学技术大学计算机系 陈香兰 2013Fall.
虚 拟 仪 器 virtual instrument
中国科学技术大学计算机系 陈香兰 Fall 2013 第三讲 线程 中国科学技术大学计算机系 陈香兰 Fall 2013.
期未報告:公眾無線網路的架構,比較 通訊所 鍾國麟 主要的內容還是S.Y.
Speaker : Chang Kai-Jia Date : 2010/04/26
NASA雜談+電腦網路簡介 Prof. Michael Tsai 2015/03/02.
SAP 架構及基本操作 SAP前端軟體安裝與登入 Logical View of the SAP System SAP登入 IDES
如何連上工作站 WorkStations: 1. Solaris 2. Linux Use X-Win32 (for Solaris)
11 Overview Cloud Computing 2012 NTHU. CS Che-Rung Lee
Operating System Software School of SCU
SAP 架構及前端軟體安裝 Logical View of the SAP System SAP Frontend 7.1安裝 SAP登入
Presentation transcript:

當企鵝龍遇上小飛象DRBL-Hadoop當企鵝龍遇上小飛象DRBL-Hadoop Jazz Wang Yao-Tsung Wang Jazz Wang Yao-Tsung Wang

Source: content/uploads/2007/08/programmer.jpghttp:// content/uploads/2007/08/programmer.jpg Source: content/uploads/2007/08/programmer.jpghttp:// content/uploads/2007/08/programmer.jpg Source: Source: Programmer v.s. System Admin.

AgendaAgenda What is Cluster Computing ? How to deploy PC cluster ? What is DRBL and Clonezilla ? Can DRBL help to deploy Hadoop ? Live Demo of DRBL Live and Clonezilla Live PART 3 : PART 1 : PART 2 :

PC Cluster 101 Jazz Wang Yao-Tsung Wang Jazz Wang Yao-Tsung Wang PART 1 :

At First, We have “ ” PC Cluster It'd better be 2 n It'd better be 2 n Manage Schedule r Manage

GiE Switch WANWAN Then, We connect 5 PCs with Gigabit Ethernet Switch Then, We connect 5 PCs with Gigabit Ethernet Switch 10/100/1000MBps10/100/1000MBps Add 1 NIC for WAN Add 1 NIC for WAN

LAN Switch WANWAN 4 Compute Nodes will communicate via LAN Switch. Only Manage Node have Internet Access for Security! Compute Nodes Manage Node

Linux Kernel Kernel Module GNU Libc Boot Loader MPICHMPICH BashBash PerlPerl MessagingMessaging YPYPNISNIS Account Mgnt. SSH D GCCGCC Compute Nodes BasicSystemSetupforClusterBasicSystemSetupforCluster

Linux Kernel Kernel Module GNU Libc Boot Loader MPICHMPICHOpenPBSOpenPBS BashBash PerlPerl MessagingMessaging YPYPNISNIS Account Mgnt. SSH D GCCGCC Job Mgnt. NFSNFS File Sharing Ex tra On Manage Node, We need to install Scheduler and Network File System for sharing Files with Compute Node On Manage Node, We need to install Scheduler and Network File System for sharing Files with Compute Node

Research topics about PC Cluster Ref: Cluster Computing in the Classroom: Topics, Guidelines, and Experiences Ref: Cluster Computing in the Classroom: Topics, Guidelines, and Experiences SystemArchitectureSystemArchitecture ParallelComputingParallelComputing ParallelAlgorithmsAndApplicationsParallelAlgorithmsAndApplications ProcessArchitectureProcessArchitecture NetworkArchitectureNetworkArchitecture StorageArchitectureStorageArchitecture System-levelMiddlewareSystem-levelMiddleware Share Memory Programming Programming Distributed Memory Programming Programming Application-level Middleware Programming Application-level

Challenges of Cluster Computing ● Hardware – Ethernet Speed / PC Density – Power / Cooling / Heat – Network and Storage Architecture ● Software – Job Scheduler ( Cluster level ) – Account Management – File Sharing / Package Management ● Limitation – Shared Memory – Global Memory Management

Common Method to deploy Cluster 1. Setup one Templatemachine Templatemachine 2. Cloning tomultiplemachine tomultiplemachine 3. Configure Settings↓ 4. Install JobScheduler↓ 5. Running Benchmark 3. Configure Settings↓ 4. Install JobScheduler↓ 5. Running Benchmark

Challenges of Common Method Upgrade Software ? Add New User Account ? Configuration Syncronization How to share user data ?

How to deploy Nodes ????

Advanced Methods to deploy Cluster ● SSI ( Single System Image ) – Multiple PCs as Single Computing Resources – Image-based ● homogeneous ● ex. SystemImager, OSCAR, Kadeploy – Package-based ● heterogeneous ● easy update and modify packages ● ex. FAI, DRBL ● Other deploy tools – Rocks : RPM only – cfengine : configuration engine

Comparison of Cluster Deploy Tools

Hadoop Deployment Tool Jazz Wang Yao-Tsung Wang Jazz Wang Yao-Tsung Wang PART 2-1 :

Source: Deploying hadoop with smartfrog Source: Deploying hadoop with smartfrog

Source: Deploying hadoop with smartfrog Source: Deploying hadoop with smartfrog

Source: Deploying hadoop with smartfrog Source: Deploying hadoop with smartfrog

Source: Deploying hadoop with smartfrog Source: Deploying hadoop with smartfrog

Source: Deploying hadoop with smartfrog Source: Deploying hadoop with smartfrog

Source: Deploying hadoop with smartfrog Source: Deploying hadoop with smartfrog

Source: Deploying hadoop with smartfrog Source: Deploying hadoop with smartfrog

Source: Deploying hadoop with smartfrog Source: Deploying hadoop with smartfrog

Source: Deploying hadoop with smartfrog Source: Deploying hadoop with smartfrog

工商服務時間工商服務時間企鵝龍與再生龍企鵝龍與再生龍 Jazz Wang Yao-Tsung Wang Jazz Wang Yao-Tsung Wang PART 2-2 :

● D iskless R emote B oot in L inux ● 網路是便宜的,人的時間才是昂貴的。 ● 企鵝龍簡單來說就是..... – 用網路線取代硬碟排線 – 所有學生的電腦都透過網路連接到一台伺服器主機 = = Server Diskles s PC Diskles s PC source: source: Diskful l PC Diskful l PC 何謂企鵝龍 DRBL ??

何謂再生龍 Clonezilla ?? ● Clone ( 複製 ) + zilla = Clonezilla ( 再生龍 ) ● 裸機備分還原工具 ● Norton Ghost 的自由軟體版替代方案 Disk to Disk Image to N Disks DisktoImageDisktoImage

需分別處理設定 ( 每班約 40 台 ) 如:電腦中毒、環境設定 系統操作問題、開關機、 備份還原等 教師 1 人維護管理多組設備 教學同時分派或收集作業 需要「化繁為簡」的解決方案! 一般國內小學的電腦教室 人力、時間成本高 設備維護成本高 降低資訊教育管理成本降低資訊教育管理成本

知識和軟體都需要讓孩子「帶著走」! 在校學習,也需回家複習 學校每台 ( 平均 ) 2 萬 學生家用 ( 平均 ) 4 萬 教育知識,也需教育尊重 尊重智財權觀念 商業軟體授權高成本 知識與法治的學習 平衡商業軟體與知識教育平衡商業軟體與知識教育

以個人叢集電腦 (PC Cluster) 經驗發展 DRBL&Clonezilla 多元化資訊教學的新選擇! 企鵝龍 DRBL 再生龍 Clonezilla 適用完整系統備份、裸機 還原或災難復原 是自由!不是免費 … 分送、修改、存取、使用軟體的自由。免費是附加價值。 適合將整個電腦教室轉換 成純自由軟體環境 (Diskless Remote Boot in Linux ) 國網中心自由軟體開發國網中心自由軟體開發

電腦教室管理的新利器! ■ 以每班 40 台電腦為估算單位 企鵝龍 DRBL 與再生龍 Clonezilla

節省龐大軟體授權費 降低台灣盜版率 提升台灣形象 降低管理維護成本 帶動自由軟體使用 節樽軟體授權成本 ( 估計 ) NT. 98,595,000 元 以某商業獨家軟體每機 3000 元授權費計, 每班 35 台電腦 (3000*35*939) 教育單位採用 DRBL 高速計算研究 資料儲存備援 擴至全國各單位

企鵝龍的開機原理企鵝龍的開機原理 Jazz Wang Yao-Tsung Wang Jazz Wang Yao-Tsung Wang PART 1-3 :

1st, We install Base System of GNU/Linux on Management Node. You can choose: Redhat, Fedora, CentOS, Mandriva, Ubuntu, Debian,... 1st, We install Base System of GNU/Linux on Management Node. You can choose: Redhat, Fedora, CentOS, Mandriva, Ubuntu, Debian,... Linux Kernel Kernel Module GNU Libc Boot Loader

2nd, We install DRBL package and configure it as DRBL Server. There are lots of service needed: SSHD, DHCPD, TFTPD, NFS Server, NIS Server, YP Server... 2nd, We install DRBL package and configure it as DRBL Server. There are lots of service needed: SSHD, DHCPD, TFTPD, NFS Server, NIS Server, YP Server... DHCP D TFTP D NFSNFS BashBashPerlPerl Network Booting YPYPNISNIS Account Mgnt. DRBL Server based on existing Open Source and keep Hacking! DRBL Server based on existing Open Source and keep Hacking! SSH D Linux Kernel Kernel Module GNU Libc Boot Loader

pxelinuxpxelinux vmlinuz-pxevmlinuz-pxe initrd-pxeinitrd-pxe Config. Files Ex. hostname Config. Files Ex. hostname After running “drblsrv -i” & “drblpush -i”, there will be pxelinux, vmlinux-pex, initrd-pxe in TFTPROOT, and different configuration files for each Compute Node in NFSROOT After running “drblsrv -i” & “drblpush -i”, there will be pxelinux, vmlinux-pex, initrd-pxe in TFTPROOT, and different configuration files for each Compute Node in NFSROOT Linux Kernel Kernel Module GNU Libc Boot Loader DHCP D TFTP D NFSNFSYPYPNISNIS SSH D

BIOS PXE 3nd, We enable PXE function in BIOS configuration. 3nd, We enable PXE function in BIOS configuration. pxelinuxpxelinux vmlinuz-pxevmlinuz-pxe initrd-pxeinitrd-pxe Config. Files Ex. hostname Config. Files Ex. hostname Linux Kernel Kernel Module GNU Libc Boot Loader DHCP D TFTP D NFSNFSYPYPNISNIS SSH D

BIOS PXE While Booting, PXE will query IP address from DHCPD. While Booting, PXE will query IP address from DHCPD. pxelinuxpxelinux vmlinuz-pxevmlinuz-pxe initrd-pxeinitrd-pxe Config. Files Ex. hostname Config. Files Ex. hostname Linux Kernel Kernel Module GNU Libc Boot Loader TFTP D NFSNFSYPYPNISNIS SSH D DHCP D

IP 1 IP 2 IP 3 IP 4 While Booting, PXE will query IP address from DHCPD. While Booting, PXE will query IP address from DHCPD. pxelinuxpxelinux vmlinuz-pxevmlinuz-pxe initrd-pxeinitrd-pxe Config. Files Ex. hostname Config. Files Ex. hostname Linux Kernel Kernel Module GNU Libc Boot Loader TFTP D NFSNFSYPYPNISNIS SSH D DHCP D

IP 1 IP 2 IP 3 IP 4 After PXE get its IP address, it will download booting files from TFTPD. Config. Files Ex. hostname Config. Files Ex. hostname Linux Kernel Kernel Module GNU Libc Boot Loader NFSNFSYPYPNISNIS SSH D DHCP D pxelinuxpxelinux vmlinuz-pxevmlinuz-pxe initrd-pxeinitrd-pxe TFTP D

IP 1 IP 2 IP 3 IP 4 Config. Files Ex. hostname Config. Files Ex. hostname Linux Kernel Kernel Module GNU Libc Boot Loader NFSNFSYPYPNISNIS SSH D DHCP D pxelinuxpxelinux vmlinuz-pxevmlinuz-pxe initrd-pxeinitrd-pxe TFTP D pxelinuxpxelinux vmlinuzvmlinuz initrdinitrd pxelinuxpxelinux vmlinuzvmlinuz initrdinitrd pxelinuxpxelinux vmlinuzvmlinuz initrdinitrd pxelinuxpxelinux vmlinuzvmlinuz initrdinitrd

Config. Files Ex. hostname Config. Files Ex. hostname Linux Kernel Kernel Module GNU Libc Boot Loader YPYPNISNIS SSH D DHCP D initrdinitrdinitrdinitrdinitrdinitrd IP 1 IP 2 IP 3 IP 4 pxelinuxpxelinux vmlinuzvmlinuz pxelinuxpxelinux vmlinuzvmlinuz pxelinuxpxelinux vmlinuzvmlinuz pxelinuxpxelinux vmlinuzvmlinuz initrdinitrd pxelinuxpxelinux vmlinuz-pxevmlinuz-pxe initrd-pxeinitrd-pxe TFTP D After downloading booting files, scripts in initrd-pxe will config NFSROOT for each Compute Node. NFSNFS

Linux Kernel Kernel Module GNU Libc Boot Loader YPYPNISNIS SSH D DHCP D initrdinitrdinitrdinitrdinitrdinitrd IP 1 IP 2 IP 3 IP 4 pxelinuxpxelinux vmlinuzvmlinuz pxelinuxpxelinux vmlinuzvmlinuz pxelinuxpxelinux vmlinuzvmlinuz pxelinuxpxelinux vmlinuzvmlinuz initrdinitrd pxelinuxpxelinux vmlinuz-pxevmlinuz-pxe initrd-pxeinitrd-pxe TFTP D Config. Files Ex. hostname Config. Files Ex. hostname NFSNFS Config. 1 Config. 2 Config. 3 Config. 4

DRBL Server YPYPNISNIS DHCP D TFTP D NFSNFS BashBashPerlPerl SSH D BashBash PerlPerl SSHDSSHD BashBash PerlPerl SSHDSSHD BashBash PerlPerl SSHDSSHD BashBash PerlPerl SSHDSSHD Applications and Services will also deployed to each Compute Node via NFS.... Applications and Services will also deployed to each Compute Node via NFS....

DRBL Server DHCP D TFTP D With the help of NIS and YP, You can login each Compute Node with the Same ID / PASSWORD stored in DRBL Server! With the help of NIS and YP, You can login each Compute Node with the Same ID / PASSWORD stored in DRBL Server! NFSNFS SSH D YPYPNISNIS SSHDSSHDSSHDSSHDSSHDSSHDSSHDSSHD SSH Client

Jazz Wang Yao-Tsung Wang Jazz Wang Yao-Tsung Wang PART 2 -1: 當企鵝龍遇上小飛象當企鵝龍遇上小飛象

使用 DRBL 佈署 Hadoop ● 仍在開發中,待整理套件 ● drbl-hadoop – 掛載本機硬碟給 HDFS 用 svn co ● hadoop-register – 註冊網站與 ssh applet svn co

關於 hadoop.nchc.org.tw ● DRBL Server - 1 台 (hadoop) ,加大 /home 與 /tftpboot 空間。 ● DRBL Client - 19 台 (hadoop101~hadoop119) ● 使用 Cloudera 的 Debian 套件 ● 使用 drbl-hadoop 的設定跟 init.d script 來協助部署 ● 使用 hadoop-register 來提供使用者註冊與 ssh applet 介面

Lesson Learn ● Cloudera 套件的好處:使用 init.d script 來啟動關閉 – name node, data node, job tracker, task tracker ● 建立大量帳號: – 可透過 DRBL 內建指令完成 /opt/drbl/sbin/drbl-useradd ● 使用者預設 HDFS 家目錄 – 跑迴圈切換使用者,下 hadoop fs -mkdir tmp ● 設定使用者 HDFS 權限 – 跑迴圈切換使用者,下 hadoop dfs -chown $(id) /usr/$(id) ● HDFS 會使用 /var/lib/hadoop/cache/hadoop/dfs ● MapReduce 會使用 /var/lib/hadoop/cache/hadoop/mapred

Jazz Wang Yao-Tsung Wang Jazz Wang Yao-Tsung Wang PART 2 -2: Live Demo

WANWAN DRBL-Live

1. Boot Server with DRBL-Live CD 2. Download DRBL-Hadoop Script Follow the steps 1. Boot Server with DRBL-Live CD 2. Download DRBL-Hadoop Script Follow the steps Demo with DRBL-Live CD

Questions?Questions? Jazz Wang Yao-Tsung Wang Jazz Wang Yao-Tsung Wang