雲端運算檔案系統HDFS.

Slides:



Advertisements
Similar presentations
C语言程序设计 李伟光.
Advertisements

教學經驗分享 吳毅成 國立交通大學資訊工程系 2012年4月.
時間:102年9月18日(星期三) 地點:國立臺灣師範大學綜合大樓509國際會議廳
云计算平台Hadoop的部署.
台灣雲端運算應用實驗中心研發計畫 計 畫 期 間:自98年7月1日至99年6月30日止 執行單位名稱 :財團法人資訊工業策進會 國立中山大學.
云梯的多namenode和跨机房之路
数据采集与Hadoop框架 报告人:黄文君 导 师:王华忠 BEA Confidential.
为教师开展大数据课程教学提供全方位、一站式服务
基于hadoop的数据仓库技术.
發展東華特色課程 期末成果發表 呂進瑞 國立東華大學財金系.
CHAPTER 8 Hadoop設定與配置.
一种基于Hadoop的视频大数据分布式解码方法 冯强
TQC+ JAVA全國教師研習會 PLWeb 程式設計練習平台 簡介.
Made by Feng Nie 开源机器学习库&Hadoop介绍 Made by Feng Nie
分項子計畫: P2P Video Streaming Multi-layer Video Distribution and Acquisition in Cloud Computing (第二季成果報告) 主持人: 許蒼嶺 研究生: 林靖辰 簡嘉威 王彥翔 蘇昭文 Dept. of Electrical.
王耀聰 陳威宇 國家高速網路與計算中心(NCHC)
設置Hadoop環境 王耀聰 陳威宇 楊順發 國家高速網路與計算中心(NCHC)
YARN & MapReduce 2.0 Boyu Diao
Hadoop 單機設定與啟動 step 1. 設定登入免密碼 step 2. 安裝java step 3. 下載安裝Hadoop
題目:十六對一多工器 姓名:李國豪 學號:B
VM架設及LAMP基本設定 陳柏盛.
第 1 章 使用 APP INVENTOR 2 開發 ANDROID APP
第3章 分布式文件系统HDFS (PPT版本号:2017年2月版本)
分布式系统中的关键概念及Hadoop的起源、架构、搭建
第2章 大数据处理架构Hadoop (PPT版本号:2017年2月版本)
快速学习环境搭建 安装前预备工作(Linux相关配置) 实操演示(hadoop、hbase为例) 总结&练习题(课后练练手)
雲端計算 參考書籍:Python+Spark 2.0+Hadoop 機器學習與大數據分析實戰
臺北市立大學 資訊科學系(含碩士班) 賴阿福
Spark零基础入门——Spark入门基础
實現雲端運算 Hadoop HDFS 磁碟及記憶體之即時分級服務
Unit 06 雲端分散式Hadoop實驗 -II
CHAPTER 6 認識MapReduce.
Working with Databases (II) 靜宜大學資管系 楊子青
R教學 安裝RStudio 羅琪老師.
《大数据技术原理与应用》 第十二讲 图计算 (2016春季学期)
Hadoop.
基于大数据的物流资源整合 福建师范大学协和学院 沈庆琼.
[LAB 3]Make OS SD Card Step1 Download the image file.
安裝JDK 安裝Eclipse Eclipse 中文化
Windoop操作步驟 於作業系統Windows 10 專業版.
OpenID與WordPress使用說明
Android App簡介及 App Inventor 2體驗 靜宜大學資管系 楊子青
雲端運算的基石(2) 虛擬化技術實作(XP篇─上)
第二章 SPSS的使用 2.1 啟動SPSS系統 2.2 結束SPSS系統 2.3 資料分析之相關檔案 2.4 如何使用SPSS軟體.
雲端分散式計算平台 Hadoop安裝使用.
雲端計算.
FTP檔案上傳下載 實務與運用.
私立南山高中 信息組 電腦研習 電腦資料的備份 中華民國 99年4月20日 星期二.
大数据介绍及应用案例分享 2016年7月 华信咨询设计研究院有限公司.
電腦攻擊與防禦 使用電腦教室VMware軟體說明.
Java程式設計 Eclipse.
建立一 function s (type) 可以用來繪製cyclic-harmonic curves
基于大数据平台数据管理研究 何家乐 2013年7月 中国科学院高能物理研究所.
App Inventor 2初體驗 靜宜大學資管系 楊子青
Linux作業系統 電腦教室Linux使用說明.
TA教育訓練 微處理機系統實習.
資料來源 2 網路過濾軟體之安裝說明 資料來源 2.
Unit 05 雲端分散式Hadoop實驗 -I M. S. Jian
讓Emulator可以 使用Android Market
密级: 亿赞普Hadoop应用浅析 IZP 肖燕京.
進度流程Demo.
如何使用Gene Ontology 網址:
計算機中心 網路規劃組 2005/07/11-12.

數位化時代教師的基本素養講習會 電腦科技 與智慧財產權法
安裝JDK 配置windows win7 環境變數
Virtualization.
方格紙上畫正方形.
大数据应用人才培养系列教材 大数据实践 刘 鹏 张 燕 总主编 袁晓东 主编 黄必栋 副主编.
王耀聰 陳威宇 國家高速網路與計算中心(NCHC)
Presentation transcript:

雲端運算檔案系統HDFS

大綱 什麼是HDFS? HDFS的架構 HDFS的布建 HDFS的觀察 HDFS的瓶頸

什麼是HDFS? HDFS全名是Hadoop Distributed File System Hadoop是Apache的一個子計畫 其本身用Java語言撰寫 其程序在Java Virtual Machine(JVM) 上運行

HDFS的架構 HDFS Process 軟體架構 HDFS Program

Namenode Secondary Namenode Datanode 負責處理來自client端的檔案存取要求 負責儲存整個HDFS中各檔案之metadata Secondary Namenode 協助Namenode整併並跟新當中的metadata 當Namenode掛點時,可手動令其做Namenode用 Datanode 為data本身存放之處 聽取Namenode的安排,然後讓client存取檔案

硬體架構

HDFS的布建 安裝Java JDK 下載hdfs軟體包並解壓縮 wget http://ftp.twaren.net/Unix/Web/apache/hadoop/co re/hadoop-0.20.1/hadoop-0.20.1.tar.gz tar –xvzf hadoop-0.20.1.tar.gz 編輯namenode、各secondary namenode及各 datanode的/etc/hosts檔,已令彼此皆有系統中 其他主機的IP、domain name及hostname對照 設定conf資料夾底下core-site.xml、hdfs- site.xml、mapred-site.xml、masters、slaves 及hadoop-env.sh六個檔案

masters: 依據/etc/hosts填寫各個secondary namenode 的hostname或IP或domain name slaves: 依據/etc/hosts填寫各個datanode 的 hostname或IP或domain name hadoop-env.sh: 啟動整個hdfs系統所需要讀入或 輸出的參數設定 core-site.xml

hdfs-site.xml

mapred-site.xml

在namenode產生ssh的rsa公鑰,然後利用scp將 這把公鑰分享給系統中其他結點,使彼此皆能在不 用使用者手動輸入密碼的情況下相互登入做存取操 作 在namenode利用scp將做完設定的軟體資料夾發 布給系統中每個結點 在namenode下達hadoop namenode –format指 令將整個HDFS格式化(僅用在啟用一個全新的 HDFS)

執行start-all.sh DataNode TaskTracker NameNode JobTracker Secondary RPC Datanodes Secondary Namenode

HDFS的觀察 整個hdfs是否有成功運行起來? 可用jps指令觀察在JVM上有哪些程序運行

在瀏覽器上輸入http://namenode IP:50070

HDFS的瓶頸 Namenode fail over沒有自動化 當Namenode要服務大量client時,可能會令服務 品質降低 Solution Hint: daemon 當Namenode要服務大量client時,可能會令服務 品質降低 Solution Hint: multipule namenode? There’s no solution so far…