Unit 06 雲端分散式Hadoop實驗 -II

Slides:



Advertisements
Similar presentations
课程介绍 (PPT版本号:2016年1月24日版本) 温馨提示:编辑幻灯片母版,可以修改每页PPT的厦大校徽和底部文字 林子雨
Advertisements

家庭財務管理首部曲 居家整理準則 首先充分發揮您所擁有的一切 然後盡情的去享受它(enjoy) 最後要好好珍惜它
高一年级过渡性学习 活动汇报 高一年级组 教科研室 汉滨高中.
第八讲 基于Hadoop的数据仓库Hive (PPT版本号:2016年4月6日版本)
Project-1 NS-2教學.
高考历史答题 技巧与方法.
《大数据技术原理与应用》 课程介绍 (2016春季学期)
資訊安全與系統管理 2013/3/13 Chien wei lin.
發展東華特色課程 期末成果發表 呂進瑞 國立東華大學財金系.
Map-Reduce Programming
CHAPTER 8 Hadoop設定與配置.
第16章 編譯與升級Kernel系統核心 課前指引
一种基于Hadoop的视频大数据分布式解码方法 冯强
Cloud Computing for Big Data – Monitoring & Resource Management
王耀聰 陳威宇 國家高速網路與計算中心(NCHC)
設置Hadoop環境 王耀聰 陳威宇 楊順發 國家高速網路與計算中心(NCHC)
Hadoop 單機設定與啟動 step 1. 設定登入免密碼 step 2. 安裝java step 3. 下載安裝Hadoop
Confidential Property
VM架設及LAMP基本設定 陳柏盛.
第3章 分布式文件系统HDFS (PPT版本号:2017年2月版本)
分布式系统中的关键概念及Hadoop的起源、架构、搭建
第2章 大数据处理架构Hadoop (PPT版本号:2017年2月版本)
快速学习环境搭建 安装前预备工作(Linux相关配置) 实操演示(hadoop、hbase为例) 总结&练习题(课后练练手)
雲端計算 參考書籍:Python+Spark 2.0+Hadoop 機器學習與大數據分析實戰
臺北市立大學 資訊科學系(含碩士班) 賴阿福
Computer Network Lab 資碩一 黃麒瑋
Spark零基础入门——Spark入门基础
雲端運算檔案系統HDFS.
基于Hadoop的数据仓库Hive.
實現雲端運算 Hadoop HDFS 磁碟及記憶體之即時分級服務
JDK 安裝教學 (for Win7) Soochow University
《大数据技术原理与应用》 第七章 MapReduce (2016春季学期) 林子雨 厦门大学计算机科学系 主页:
Hadoop平台使用 计算中心
第二章 Linux基本指令與工具操作 LINUX 按圖施工手冊.
Wireless and Mobile Multimedia Networks
Working with Databases (II) 靜宜大學資管系 楊子青
Hadoop平台與應用規劃實作 報告者:劉育維.
Map Reduce Programming
《大数据技术原理与应用》 第十二讲 图计算 (2016春季学期)
Hadoop.
基于大数据的物流资源整合 福建师范大学协和学院 沈庆琼.
伺服器探索營 Day 1 指導老師: 張啟中 (JohnAxer) 教學助理:
安裝JDK 安裝Eclipse Eclipse 中文化
Windoop操作步驟 於作業系統Windows 10 專業版.
Unit 04 虛擬機器建構實驗 M. S. Jian Department of Computer Science and Information Engineering National Formosa University Yunlin, Taiwan, ROC.
雲端分散式計算平台 Hadoop安裝使用.
TinyOS开发环境安装 基于Ubuntu14.04.
Linux核心編譯與模組管理 2013/01/19.
雲端計算.
编辑文本文件 软件包管理 Samba 在Linux下使用Windows共享打印机
2017 Operating Systems 作業系統實習 助教:陳主恩、林欣穎 實驗室:720A Lab3.
系统管理员培训(I期) 浙江省基层人民法院 -V8版介绍及系统管理培训 二OO八年四月二十三日 法院事业部经理:周春宏
Confidential Property
Unit 05 雲端分散式Hadoop實驗 -I M. S. Jian
2018 Operating Systems 作業系統實習 助教:林欣穎 實驗室:720A Lab3.
UNIX指令-檔案與目錄操作.
实验一:编译运行Linux内核并使用gdb进行调试
雲端計算.
編輯網頁可用那些應用程式? 記事本 Word FrontPage Dreamweaver.
Unix 安裝過程 使用2個磁片 到 rawwrite bootnet.img drvnet.img 利用rawwrite 將image檔寫入磁片.
基本指令.
Cloud Operating System - Unit 03: 雲端平台建構實驗
安裝JDK 配置windows win7 環境變數
NS3 & NS2 (network simulator)
Tree Riddles Kun-Mao Chao (趙坤茂)
Tree Riddles Kun-Mao Chao (趙坤茂)
大数据应用人才培养系列教材 大数据实践 刘 鹏 张 燕 总主编 袁晓东 主编 黄必栋 副主编.
DDoS A note given in BCC class on May 15, 2013 Kun-Mao Chao (趙坤茂)
王耀聰 陳威宇 國家高速網路與計算中心(NCHC)
Presentation transcript:

Unit 06 雲端分散式Hadoop實驗 -II M. S. Jian Department of Computer Science and Information Engineering National Formosa University Yunlin, Taiwan, ROC

Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II 首先要進行Java相關安裝 由於Java相關套件並不一定直接做為自由軟體包裝於Ubuntu的軟體庫中,因此需要針對套件庫作內容連結的更新 11/22/2018 Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II

Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II 首先針對套件來源路徑更新 sudo gedit(或vi) /etc/apt/sources.list 將出現所有套件路徑中的 tw.achieve.com 置換成ubuntu.stu.edu.tw 11/22/2018 Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II

Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II 安裝Java sudo apt-get purge java-gcj-compat sudo add-apt-repository "deb http://archive.canonical.com/ lucid partner" sudo apt-get update 以上會因為Ubuntu不同而有 不同的安裝結果訊息 11/22/2018 Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II

Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II 安裝Java(2) sudo apt-get install sun-java6-jdk sun-java6-plugin sudo update-java-alternatives -s java-6-sun ----------------以上為sun Java安裝------- sudo apt-get install openjava-6-jdk ----------------以上為OpenJava安裝----- 11/22/2018 Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II

Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II 確認Java版本 安裝結束後可以確認Java版本 java –version OpenJava 須為6以上版本 Sun Java須為1.6以上版本 11/22/2018 Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II

Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II 安裝通訊連線 接著安裝ssh & rsync sudo apt-get install ssh rsync Hadoop在不同機器上運作時 會使用的通訊連線方式 11/22/2018 Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II

Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II 若已經是超級使用者 可以不使用sudo指令 先進入opt路徑 cd /opt 下載Hadoop套件 sudo wget http://apache.stu.edu.tw//hadoop/common/hadoop-0.20.203.0/ hadoop-0.20.203.0rc1.tar.gz 解壓縮 sudo tar zxvf hadoop-0.20.203.0rc1.tar.gz 移動資料夾 sudo mv hadoop-0.20.203.0/ hadoop 11/22/2018 Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II

Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II 設定群組與使用者 若已經是超級使用者 可以不使用sudo指令 創建群組 sudo addgroup hadoop 設定一個使用者名稱是Hadoop,在Hadoop群組下 sudo adduser --ingroup hadoop hadoop 更改資料夾權限 sudo chown -R hadoop:hadoop hadoop 或 chown -R hadoop /opt/hadoop 11/22/2018 Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II

Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II 若已經是超級使用者 可以不使用sudo指令 建立資料夾 sudo mkdir /var/hadoop 更改權限 sudo chown -R hadoop:hadoop /var/hadoop 11/22/2018 Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II

以Hadoop身分登入 su – hadoop 於opt路徑中,修改設定 sudo gedit(或vi) hadoop/conf/hadoop-env.sh 新增設定 export JAVA_HOME=/usr/lib/jvm/java-6-sun export HADOOP_HOME=/opt/hadoop export HADOOP_CONF_DIR=/opt/hadoop/conf 若使用OpenJava 路徑更改為 /usr/lib/jvm/java-6-openjdk 11/22/2018 Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II

Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II 修改core-site.xml sudo gedit(或vi) hadoop/conf/core-site.xml <configuration> <property> <name>fs.default.name</name> <value>hdfs://localhost:9000</value> </property> <name>hadoop.tmp.dir</name> <value>/var/hadoop/hadoop-${user.name}</value> </configuration> 11/22/2018 Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II

Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II 修改hdfs-site.xml sudo gedit(或vi) hadoop/conf/hdfs-site.xml <configuration> <property> <name>dfs.replication</name> <value>1</value> </property> </configuration> 11/22/2018 Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II

Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II 修改mapred-site.xml sudo gedit(或vi) hadoop/conf/mapred-site.xml <configuration> <property> <name>mapred.job.tracker</name> <value>localhost:9001</value> </property> </configuration> 11/22/2018 Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II

Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II 在Hadoop身分下,到/opt/hadoop路徑啟動 格式化 namenode bin/hadoop namenode -format 啟動Hadoop服務 bin/start-all.sh 查看啟動結果 jps 11/22/2018 Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II

Hadoop與MapReduce範例操作 wget http://trac.nchc.org.tw/cloud/raw-attachment/wiki/Hadoop_Lab4/nchc-example.jar 測試 bin/hadoop jar nchc-example.jar bin/hadoop jar nchc-example.jar hello 11/22/2018 Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II

實際練習Hadoop與MapReduce Word Count 初級 mkdir lab4_input echo “I like NCHC Cloud Course.” > lab4_input/input1 echo “I like nchc Cloud Course, and we enjoy this course.” > lab4_input/input2 bin/hadoop fs -put lab4_input lab4_input bin/hadoop fs -ls lab4_input 11/22/2018 Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II

Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II 執行Word Count範例 於 wget http://trac.nchc.org.tw/cloud/raw-attachment/wiki/Hadoop_Lab4/WordCount.java Mkdir MyJava javac –classpath hadoop-core-0.20.203.0.jar -d MyJava WordCount.java jar -cvf wordcount.jar -C MyJava . bin/hadoop jar wordcount.jar WordCount lab4_input/ lab4_out1/ bin/hadoop fs -cat lab4_out1/part-r-00000 11/22/2018 Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II

Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II Web網頁型態界面 http://localhost:50030/ - Hadoop 管理介面 http://localhost:50060/ - Hadoop Task Tracker 狀態 http://localhost:50070/ - Hadoop DFS 狀態 11/22/2018 Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II

Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II 範例 11/22/2018 Cloud Operating System - Unit 06: 雲端分散式Hadoop實驗 -II