雲端分散式計算平台 Hadoop安裝使用.

Slides:

Advertisements

Similar presentations

第八讲基于Hadoop的数据仓库Hive （PPT版本号：2016年4月6日版本）

Advertisements

基于Hadoop的Map/Reduce框架研究报告

云计算平台Hadoop的部署.

台灣雲端運算應用實驗中心研發計畫計畫期間：自98年7月1日至99年6月30日止執行單位名稱：財團法人資訊工業策進會國立中山大學.

数据采集与Hadoop框架报告人：黄文君导师：王华忠 BEA Confidential.

資訊安全與系統管理 2013/3/13 Chien wei lin.

CHAPTER 8 Hadoop設定與配置.

一种基于Hadoop的视频大数据分布式解码方法冯强

TQC+ JAVA全國教師研習會 PLWeb 程式設計練習平台簡介.

王耀聰陳威宇國家高速網路與計算中心(NCHC)

設置Hadoop環境王耀聰陳威宇楊順發國家高速網路與計算中心(NCHC)

Hadoop 單機設定與啟動 step 1. 設定登入免密碼 step 2. 安裝java step 3. 下載安裝Hadoop

Confidential Property

VM架設及LAMP基本設定陳柏盛.

主讲：邓志龙 Linux网络技术主讲：邓志龙

第2章大数据处理架构Hadoop （PPT版本号：2017年2月版本）

快速学习环境搭建安装前预备工作（Linux相关配置）实操演示（hadoop、hbase为例) 总结&练习题（课后练练手）

雲端計算參考書籍：Python+Spark 2.0+Hadoop 機器學習與大數據分析實戰

臺北市立大學資訊科學系(含碩士班) 賴阿福

王耀聰陳威宇國家高速網路與計算中心(NCHC)

雲端運算檔案系統HDFS.

基于Hadoop的数据仓库Hive.

JDK 安裝教學 (for Win7) Soochow University

Linux基本操作實習1.

基礎linux指令說明 Part 1 資訊組陳宜徽.

第1章認識Arduino.

Small Cell創新應用與服務專題實驗單元：建立Small Cell執行環境

Unit 06 雲端分散式Hadoop實驗 -II

資料庫管理操作DBMS 指導教授：楊維邦　助教：廖皓翔.

第二章 Linux基本指令與工具操作 LINUX 按圖施工手冊.

CHAPTER 6 認識MapReduce.

Working with Databases (II) 靜宜大學資管系楊子青

R教學安裝RStudio 羅琪老師.

《大数据技术原理与应用》第十二讲图计算（2016春季学期）

伺服器探索營 Day 1 指導老師：張啟中 (JohnAxer) 教學助理：

安裝JDK 安裝Eclipse Eclipse 中文化

Homework 1(上交时间：10月14号) 倒排索引.

自由軟體介紹(一) 把flash通通帶回家報告人:陳俊銘.

Windoop操作步驟於作業系統Windows 10 專業版.

Android App簡介及 App Inventor 2體驗靜宜大學資管系楊子青

FTP檔案上傳下載實務與運用.

TinyOS开发环境安装基于Ubuntu14.04.

Linux核心編譯與模組管理 2013/01/19.

编辑文本文件软件包管理 Samba 在Linux下使用Windows共享打印机

Java程式設計 Eclipse.

2017 Operating Systems 作業系統實習助教：陳主恩、林欣穎實驗室：720A Lab3.

App Inventor 2初體驗靜宜大學資管系楊子青

Linux作業系統電腦教室Linux使用說明.

系统管理员培训(I期) 浙江省基层人民法院－V8版介绍及系统管理培训二ＯＯ八年四月二十三日法院事业部经理:周春宏

Confidential Property

Unit 05 雲端分散式Hadoop實驗 -I M. S. Jian

2018 Operating Systems 作業系統實習助教：林欣穎實驗室：720A Lab3.

Google協作平台+檔案分享(FileZilla+網路芳鄰)

FTP使用教學簡介: 軟體名稱：FileZilla 軟體性質：Ｆreeware 版本：繁體中文版

網路資源的建立--LINUX系統系統管理

MiRanda Java Interface v1.0的使用方法

Unix 安裝過程使用2個磁片到 rawwrite bootnet.img drvnet.img 利用rawwrite 將image檔寫入磁片.

Cloud Operating System - Unit 03: 雲端平台建構實驗

Brief Guide of FrontPage

安裝JDK 配置windows win7 環境變數

Virtualization.

王耀聰陳威宇國家高速網路與計算中心(NCHC)

Unix指令4-文字編輯與程式撰寫.

Develop and Build Drives by Visual C++ IDE

雲端電腦教室 Matlab 使用介紹 1. 工作目錄切換 2. 把 matlab 的檔案存出來 3. Matlab 軟體介面.

Presentation transcript:

雲端分散式計算平台 Hadoop安裝使用

Outline Hadoop簡介 Map-Reduce架構 VM安裝Ubuntu Hadoop安裝&設定參考

Hadoop簡介 Hadoop是Apache底下的開放原始碼計劃 (Open source project)以，以java寫成，可以提供大量資料的分散式運算環境。 Hadoop中包括許多子計劃，其中Hadoop MapReduce如同Google MapReduce，提供分散式運算環境、Hadoop Distributed File System如同Google File System，提供大量儲存空間。Hadoop 的HBase是一個類似 BigTable 的分散式資料庫，還有其他部份可用來將這三個主要部份連結在一起，方便提供整合的雲端服務。

Map-Reduce架構 MapReduce是一個分散式程式框架，讓服務開發者可以很簡單的撰寫程式，利用大量的運算資源，加速處理龐大的資料量一個MapReduce的運算工作可以分成兩個部份:Map和Reduce，大量的資料在運算開始的時候，會被系統轉換成一組組 (key, value) 的序對並自動切割成許多部份，分別傳給不同的Mapper來處理，Mapper處理完成後也要將運算結果整理成一組組 (key, value) 的序對，再傳給Reducer整合所有Mapper的結果，最後才能將整體的結果輸出

Example wordcount

Ubuntu安裝 VM安裝ubuntu-10.04.4-server-i386.iso

Ubuntu安裝(續) 設定hostname

Ubuntu安裝(續)

Ubuntu安裝(續) Choose Open SSH server to install

Ubuntu安裝(續)

Ubuntu安裝(續) 輸入帳號密碼驗證安裝結果

Ubuntu安裝(續) 安裝完成

安裝jdk 取得root權限先取得軟體源，再安裝JDK sudo apt-get install python-software-properties sudo add-apt-repository ppa:ferramroberto/java sudo apt-get update sudo apt-get install sun-java6-jdk

建立hadoop使用者使用addgroup hadoop指令建立新的群組使用adduser –ingroup hadoop hadoop指令新增使用者hadoop至hadoop群組中使用vim /etc/passwd指令編輯passwd檔案

修改sudo權限最後一行 “x”刪除掉編輯sudoer 加入存檔離開 visudo vim /etc/sudoer hadoop ALL=(ALL) ALL 使用者帳號登入者的來源主機名稱=(可切換的身份) 可下達的指令存檔離開 Ctrl+X :wq

ssh免密碼登入使用 su – hadoop指令切換使用者為Hadoop 產生key ssh-keygen –t rsa –P “” 將 public key拷貝到遠端的電腦後, 加到該user的 .ssh/authorized_keys 中 cat /home/hadoop/.ssh/id_rsa.pub >> /home/hadoop/.ssh/authorized_keys 離開切換回使用者root http://blog.longwin.com.tw/2005/12/ssh_keygen_no_passwd/

Hadoop安裝下載 hadoop-1.2.1 移動至/usr/local 下解壓縮 wget http://140.116.82.153/~easer/hadoop-1.2.1.tar.gz 移動至/usr/local 下解壓縮 mv hadoop-1.2.1.tar.gz /usr/local cd /usr/local tar –xvf hadoop-1.2.1.tar.gz

Hadoop安裝(續) 改變檔案擁有者製作捷徑到使用者hadoop的home下刪除下載的檔案 chown –R hadoop:hadoop hadoop-1.2.1 製作捷徑到使用者hadoop的home下 ln –s hadoop-1.2.1/ /home/hadoop/hadoop 刪除下載的檔案 rm –rf hadoop-1.2.1.tar.gz

設定 /etc/hosts 使用 vi /etc/hosts指令修改etc資料夾下的hosts檔案加入 192.168.56.101 u02 設定這個ip為自己

設定 interfaces 先查看網卡編號 ifconfig -a

使用 vim /etc/network/interfaces 指令修改interfaces檔案

Hadoop設定(續) 使用 /etc/init.d/networking restart 指令重開網路使用ifconfig –a 查看目前網路設定是否改為設定的結果

Hadoop設定使用 su – hadoop 指令改變使用者為Hadoop cd ~/hadoop or cd /usr/local/hadoop-1.2.1 使用vim conf/hadoop-env.sh指令修改檔案加入 export JAVA_HOME=/usr/lib/jvm/java-6-sun 及 export HADOOP_OPTS=“-Djava.net.preferIPv4Stack=true”

Hadoop設定(續) 使用 mkdir ~/single 指令新增資料夾使用 vim conf/core-site.xml 指令修改檔案加入圖示中之兩個property

Hadoop設定(續) 使用 vim conf/mapred-site.xml 指令修改檔案加入圖示中之property

Hadoop設定(續) 使用 vim conf/hdfs-site.xml 指令修改檔案加入圖示中之property

Hadoop設定(續) 使用 vim conf/masters指令修改masters檔案設定master僅有u02 使用 vim conf/slaves指令修改slaves檔案設定slave僅有u02

Hadoop設定(續) 使用 bin/hadoop namenode –format 指令啟用namenode及查看設定使用 bin/start-all.sh 開啟系統

Hadoop設定(續) 使用 jps 指令查看目前開啟之相關processes 使用 bin/hadoop dfsadmin –report 指令查看目前dfs之報告

Hadoop設定(續) 使用 bin/hadoop dfsadmin –safemode leave 指令離開安全模式使用 bin/hadoop dfs –mkdir input 新增input資料夾使用 bin/hadoop dfs –lsr指令編輯single.txt

Hadoop設定(續) 編輯single.txt 輸入一段文字以利使用example範例之wordcount程式 bin/hadoop dfs –put single.txt input

Hadoop設定(續) 使用bin/hadoop jar hadoop-1.2.1.example.jar wordcount input output指令執行wordcount

Hadoop設定(續) 看結果 bin/hadoop dfs –cat output/part-r-00000

Web interface 修改windows中C:\Windows\System32\drivers\etc\hosts檔案加入 192.168.56.101 u02 設定此IP為u02

Web interface (續) 打開瀏覽器網址輸入http://u02:50070/ 可察看目前之使用情形

Web interface(續) 打開瀏覽器網址輸入http://192.168.56.101:50030/ 可察看job使用情形

練習架設兩台node 執行更大的檔案編譯wordcount程式

新增node設定在第一個node 在第二個node 編輯/etc/hosts 增加node 2 的IP與hostname 重新啟動網卡編輯~/hadoop/conf/slaves 增加node 2的hostname 在第二個node 修改網卡設定指派node 2 的IP

重新格式化與執行Hadoop 因Node 1 為 master，故在Node 1操作刪除 node 1 & 2 的Hadoop tmp資料夾 rm –r ~/single/hadoop-hadoop 格式化namenode 啟動hadoop

編譯程式下載原始碼 WordCount.java 編譯檔Makefile Input 資料 wget http://140.116.82.153/~easer/WordCount.java 編譯檔Makefile wget http://140.116.82.153/~easer/makefile Input 資料 wget http://140.116.82.153/~easer/textfile ~/hadoop/bin/hadoop dfs –mkdir input2 ~/hadoop/bin/hadoop dfs –put textfile input2/ make clean make

參考 http://www.youtube.com/watch?v=Vf1HD4TjMDM&list=UUblZ4zYwgBx2j_B4ciTJMfg&index=40&feature=plcp http://en.wikipedia.org/wiki/Apache_Hadoop http://hadoop.apache.org/ http://www.slideshare.net/waue/hadoop-map-reduce-3019713