實現雲端運算 Hadoop HDFS 磁碟及記憶體之即時分級服務

Slides:

Advertisements

Similar presentations

四川财经职业学院会计一系会计综合实训目录情境 1.1 企业认知情境 1.3 日常经济业务核算情境 1.4 产品成本核算情境 1.5 编制报表前准备工作情境 1.6 期末会计报表的编制情境 1.2 建账.

Advertisements

主编：邓萌【点按任意键进入】【第六单元】教育口语. 幼儿教师教育口语概论模块一幼儿教师教育口语分类训练模块二适应不同对象的教育口语模块三《幼儿教师口语》编写组.

第一組加減法思澄、博軒、暐翔、寒菱. 大綱 1. 加減法本質 2. 迷思概念 3. 一 ~ 七冊分析 4. 教材特色.

第 3 章操作系统基础 3.1 操作系统概述 3.2 操作系统的功能模块 3.3 典型操作系统概述.

海南医学院附院妇产科教室华少平妊娠合并心脏病  概述  妊娠、分娩对心脏病的影响  心脏病对妊娠、分娩的影响  妊娠合病心脏病的种类  妊娠合并心脏病对胎儿的影响  诊断  防治.

植树节的由来植树节的意义各国的植树节纪念中山先生植树节的由来历史发展到今天， “ 植树造林，绿化祖国 ” 的热潮漫卷了中华大地。从沿海到内地，从城市到乡村，涌现了多少造林模范，留下了多少感人的故事。婴儿出世，父母栽一棵小白怕，盼望孩子和小树一样浴光吮露，茁壮成长；男女成婚，新人双双植一株嫩柳，象征家庭美满，幸福久长；

客户协议书填写样本和说明河南省郑州市金水路 299 号浦发国际金融中心 13 层吉林钰鸿国创贵金属经营有限公司.

浙江省县级公立医院改革与剖析马进上海交通大学公共卫生学院

第二章环境.

產學攜手合作計畫楊授印國立虎尾科技大學推廣教育中心主任動力機械工程系助理教授民國103年10月30日.

教师招聘考试政策解读讲师：卢建鹏

了解语文课程的基本理念，把握语文素养的构成要素。把握语文教育的特点，特别是开放而有活力的语文课程的特点。

北台小学构建和谐师生关系做幸福教师 2012—2013上职工大会.

福榮街官立小學我家孩子上小一.

第2期技職教育再造方案（草案）教育部 101年12月12日 1 1.

企业员工心态管理培训企业员工心态管理培训讲师：谭小琥.

历史人物的研究 ----曾国藩组员: 乔立蓉杜曜芳杨慧组长:马学思杜志丹史敦慧王晶.

教育部高职高专英语类专业教学指导委员会刘黛琳山东 • 二○一一年八月

淡雅诗韵七（12）班第二组蔡聿桐.

第七届全国英语专业院长/系主任高级论坛汇报材料

小數怕長計, 高糖飲品要節制瑪麗醫院營養師張桂嫦.

制冷和空调设备运用与维修专业全日制2+1中等职业技术专业.

会计信息分析与运用 —浙江古越龙山酒股份有限公司财务分析组员：2006级工商企业管理专业金国芳叶乐慧魏观红徐挺挺虞琴琴.

中华字库的云输入法王勇基础软件国家工程研究中心

第六章人体生命活动的调节人体对外界环境的感知.

芹菜英语051班 9号黄秋迎概论:芹菜是常用蔬菜之一，既可热炒，又能凉拌，深受人们喜爱。近年来诸多研究表明，这是一种具有很好药用价值的植物。别名:旱芹、样芹菜、药芹、香芹、蒲芹。芹菜属于花,芽及茎类。

2012年学生党支部书记工作交流大连理工大学建工学部孟秀英

北京市职业技能鉴定管理中心试题管理科.

完善固定资产加速折旧企业所得税政策.

2014吉林市卫生局事业单位招聘153名工作人员公告解读

各類所得扣繳法令與申報實務財政部北區國稅局桃園分局 103年9月25日

初級游泳教學.

爱国卫生工作的持续发展区爱卫办俞贞龙.

第八章数学活动方程组图象解法和实际应用

本课内容提要一、汇率的含义二、汇率变化与币值的关系三、汇率变化的影响. 本课内容提要一、汇率的含义二、汇率变化与币值的关系三、汇率变化的影响.

2011计算机类教研活动陈国久.

精品开放课程的建设与应用谢幼如教授广东省高校教育技术中心华南师范大学教育信息技术学院

Foundations of Computer Science

食品添加剂生产许可情况介绍江苏省食品药品监督管理局彭弘雷 2014年12月

IT原理与应用（1）-电脑系统 IT Principles and Applications (1) - Computer System

教育部技職司北區：2015年10月12日下午南區：2015年10月16日下午

第11章海量信息存储主讲：刘方明副教授华中科技大学计算机学院

云梯的多namenode和跨机房之路

HADOOP的高能物理分析平台孙功星高能物理研究所/计算中心

数据采集与Hadoop框架报告人：黄文君导师：王华忠 BEA Confidential.

發展東華特色課程期末成果發表呂進瑞國立東華大學財金系.

一种基于Hadoop的视频大数据分布式解码方法冯强

報告人：王月杏行動電話台南市九十九年度電腦維運相關事宜報告人：王月杏行動電話

99年台南市中小學電腦維運 --招標結果暨配發說明

3.1主板的组成 3.2主板分类 3.3主板的选购 3.4主流主板芯片组技术参数

第3章分布式文件系统HDFS （PPT版本号：2017年2月版本）

分布式系统中的关键概念及Hadoop的起源、架构、搭建

第2章大数据处理架构Hadoop （PPT版本号：2017年2月版本）

快速学习环境搭建安装前预备工作（Linux相关配置）实操演示（hadoop、hbase为例) 总结&练习题（课后练练手）

99(1)義守大學工讀職場技能精進訓練班資訊工程系林義隆老師

Hadoop平台使用计算中心

CHAPTER 6 認識MapReduce.

Cloud Computing(雲端運算) 技術的現況與應用

基于大数据的物流资源整合福建师范大学协和学院沈庆琼.

1-1-1作業系統的功能提供使用者操作介面提供程式執行環境控制輸入\輸出程序分配系統資源管理與維護磁碟中的檔案

计算机组装、维修及实训教程第15章微机硬件的组装 2018年12月25日星期二.

和諧社區資訊服務推廣計畫 -軟體雲端社區資訊研習營

作業系統 (Operating System)

电脑配置单1 配件名称型号价格(元) CPU AMD双核速龙4000+（三年原盒） 510 散热器盒装自带 -- 主板

校園雲端輸出管理系統新印科技股份有限公司聯絡人：伍宏一電話： /

基于大数据平台数据管理研究何家乐 2013年7月中国科学院高能物理研究所.

应用型本科院校大数据专业实践教学环境改革与探索

Unit 05 雲端分散式Hadoop實驗 -I M. S. Jian

微机原理与接口技术 ——第三章 80x86微处理器西安邮电大学计算机学院范琳.

密级：亿赞普Hadoop应用浅析 IZP 肖燕京.

Presentation transcript:

實現雲端運算 Hadoop HDFS 磁碟及記憶體之即時分級服務輔仁大學資訊工程研究所指導老師：葉佐任博士研究生：孫逸峰

Outline Introduction Background Design and Implementation Experiment Future Work Conclusion

Introduction (1) CPU與硬碟效能上的差距。雲端系統中執行程式的效能瓶頸。提升雲端系統中程式的執行I/O優先權，縮短I/O優先權程式執行時間。結合作業系統核心(kernel)與Hadoop，發展具有I/O優先權機制的雲端環境。

Linux Operating System Introduction (2) Hadoop Linux Operating System Hardware User Interface MapReduce Hadoop Distributed File System (HDFS)

Background (1) 讀取HDFS檔案流程 Hadoop Hadoop客戶端 Namenode Datanode1 Namenode,我要讀取123.txt 請至Datanode2中第5~10的區塊讀取 Hadoop客戶端 Namenode 5 6 7 8 9 10 Datanode1 Datanode2 Datanode3

Background (2) 寫入檔案至HDFS流程 Hadoop Hadoop客戶端 Namenode Datanode1 Namenode,我要寫入456.txt Datanode1,我要寫入456.txt 請寫入至Datanode1中 456.txt 1 2 3 4 Hadoop客戶端 Namenode 1 2 3 4 1 2 3 4 Datanode1 Datanode2 Datanode3

Background (3) JobTracker分配MapReduce工作流程 Datanode1 (Tasktracker1) Namenode (JobTracker) Datanode2 (TaskTracker2) job1 1 2 3 4 5 6 Datanode3 (TaskTracker3) job2 7 8 9 6 10 11 12

Background (4) Completely Fair Queuing (CFQ)為Linux預設使用的磁碟排程器。 PCFQ為在CFQ磁碟排程器中加入優先權的研究。

Design and Implementation (1) 研究設計重點部分: - 修改Hadoop中HDFS運作機制。 - 於kernel中使用PCFQ磁碟排程器，並將記憶體置換機制加入優先權概念。 - 提供使用者執行I/O優先權的介面。

Design and Implementation (2) Namenode建立優先權名單，並管控使用者能否執行I/O優先權指令的權力。

Design and Implementation (3) 客戶端成功申請I/O優先權後，可使用sethigh指令提升程式的I/O優先權。 sethigh指令提高程式I/O優先權範例: 客戶端修改socket封包內容並送往給Datanode sethigh hadoop fs –get source-file destination-file

Design and Implementation (4) 客戶端發送讀取HDFS檔案的socket封包內容 - passpriority為1代表具有I/O優先權，為0則沒有。

Design and Implementation (5) 客戶端發送寫入HDFS檔案的socket封包內容 - passpriority為1代表具有I/O優先權，為0則沒有。

Design and Implementation (6) Datanode接收工作要求封包，將檢查封包中passpriority欄位值。詢問Namenode此封包的發送者是否為合法的I/O優先權使用者。 Namenode若回傳True，Datanode則告知PCFQ磁碟排程器此封包要求為具有I/O優先權。

Experiment (1) 實驗環境 Hadoop環境中有一台Namenode與三台Datanode Software Hardware Ubuntu 12.04 LTS with kernel 2.6.33.3 Hadoop 1.2.1 Hardware Namenode: CPU: Intel Core i5-2400S 2.50GHz RAM: 4GB DDR3 Hard Disk: SATA3 500GB 7200rpm

Experiment (2) 實驗環境 Hardware Datanode: CPU: Intel Core 2 Duo E8400 3.00GHz RAM: 2GB DDR2 Hard Disk: SATA3 500GB 7200rpm 網路設備: Gigabit switch with Cat5e network wire

Experiment (3) 實驗設計 - 模擬一個忙碌的Hadoop環境，同時執行多個程式，並分別執行以下實驗。 - TestDFSIO - TeraSort - HDFS讀寫檔案程式

Experiment (4) 實驗設計 - 在以下三種情形中進行實驗數據比較

Experiment (5) 設定TestDFSIO(w)為I/O優先權程式

Experiment (6) 設定TestDFSIO(r)為I/O優先權程式

Experiment (7) 設定Terasort為I/O優先權程式(1)

Experiment (8) 討論Terasort提升效率不明顯之原因: - Terasort為CPU-bound的工作

Experiment (9) 設定Terasort為I/O優先權程式(2)

Experiment (10) 設定Terasort為I/O優先權程式(3)

Experiment (11) 權程式執行效率之原因: 全為執行MapReduce程式可提升具有I/O優先 MapReduce程式須經由JobTracker排班分配工作具有I/O優先權的程式能提早將MapReduce程式所需要的檔案資料傳至HDFS中比其它無I/O優先權程式更早被JobTracker分配工作給TaskTracker執行。

Experiment (12) 設定讀取檔案程式READ10G_1為I/O優先權程式

Experiment (13) 設定讀取檔案程式WRITE10G_1為I/O優先權程式

Experiment (14) 設定READ10G_1、 READ10G_2、 READ10G_3為I/O優先權程式

Experiment (15) 設定READ10G_1、 READ10G_2、 WRITE10G_1為I/O優先權程式

Experiment (16) 設定READ10G_1、 WRITE10G_1、 WRITE10G_2為I/O優先權程式

Experiment (17) 設定WRITE10G_1、 WRITE10G_2、 WRITE10G_3為I/O優先權程式

Experiment (18) 設定READ10G_1為I/O優先權程式(加入MapReduce工作一起執行)

Experiment (19) 設定WRITE10G_1為I/O優先權程式(加入MapReduce工作一起執行)

Future Work Hadoop部分: - 結合JobTracker的工作排班機制作業系統部分: - 結合CPU優先權機制 - 結合磁碟NCQ指令加入優先權的概念

Conclusion Hadoop HDFS中加入I/O優先權機制，能有效提升具有I/O優先權程式的執行效能。 Hadoop中新增處理I/O優先權的機制後，在只執行一般程式下，幾乎不會影響執行效率。

Thank you

補充資料 (1) HDFS讀取檔案流程:

補充資料 (2) HDFS寫入檔案流程:

補充資料 (3) Linux kernel 原始記憶體置換機制:

補充資料 (4) Linux kernel 優先權頁面記憶體置換機制:

補充資料 (5) I/O優先權傳遞流程: