實現雲端運算 Hadoop HDFS 磁碟及記憶體之即時分級服務

Slides:



Advertisements
Similar presentations
四川财经职业学院会计一系会计综合实训 目录 情境 1.1 企业认知 情境 1.3 日常经济业务核算 情境 1.4 产品成本核算 情境 1.5 编制报表前准备工作 情境 1.6 期末会计报表的编制 情境 1.2 建账.
Advertisements

主编:邓萌 【点按任意键进入】 【第六单元】 教育口语. 幼儿教师教育口 语概论 模块一 幼儿教师教育口语 分类训练 模块二 适应不同对象的教 育口语 模块三 《幼儿教师口语》编写组.
第一組 加減法 思澄、博軒、暐翔、寒菱. 大綱 1. 加減法本質 2. 迷思概念 3. 一 ~ 七冊分析 4. 教材特色.
第 3 章操作系统基础 3.1 操作系统概述 3.2 操作系统的功能模块 3.3 典型操作系统概述.
海南医学院附 院妇产科教室 华少平 妊娠合并心脏病  概述  妊娠、分娩对心脏病的影响  心脏病对妊娠、分娩的影响  妊娠合病心脏病的种类  妊娠合并心脏病对胎儿的影响  诊断  防治.
植树节的由来 植树节的意义 各国的植树节 纪念中山先生 植树节的由来 历史发展到今天, “ 植树造林,绿化祖国 ” 的热潮漫卷 了中华大地。从沿海到内地,从城市到乡村,涌现了多少 造林模范,留下了多少感人的故事。婴儿出世,父母栽一 棵小白怕,盼望孩子和小树一样浴光吮露,茁壮成长;男 女成婚,新人双双植一株嫩柳,象征家庭美满,幸福久长;
客户协议书 填写样本和说明 河南省郑州市金水路 299 号浦发国际金融中 心 13 层 吉林钰鸿国创贵金属经营有 限公司.
浙江省县级公立医院改革与剖析 马 进 上海交通大学公共卫生学院
第二章 环境.
產學攜手合作計畫 楊授印 國立虎尾科技大學 推廣教育中心 主任 動力機械工程系 助理教授 民國103年10月30日.
教师招聘考试 政策解读 讲师:卢建鹏
了解语文课程的基本理念,把握语文素养的构成要素。 把握语文教育的特点,特别是开放而有活力的语文课程的特点。
北台小学 构建和谐师生关系 做幸福教师 2012—2013上职工大会.
福榮街官立小學 我家孩子上小一.
第2期技職教育再造方案(草案) 教育部 101年12月12日 1 1.
企业员工心态管理培训 企业员工心态管理培训讲师:谭小琥.
历史人物的研究 ----曾国藩 组员: 乔立蓉 杜曜芳 杨慧 组长:马学思 杜志丹 史敦慧 王晶.
教育部高职高专英语类专业教学指导委员会 刘黛琳 山东 • 二○一一年八月
淡雅诗韵 七(12)班 第二组 蔡聿桐.
第七届全国英语专业院长/系主任高级论坛 汇报材料
小數怕長計, 高糖飲品要節制 瑪麗醫院營養師 張桂嫦.
制冷和空调设备运用与维修专业 全日制2+1中等职业技术专业.
会计信息分析与运用 —浙江古越龙山酒股份有限公司财务分析 组员:2006级工商企业管理专业 金国芳 叶乐慧 魏观红 徐挺挺 虞琴琴.
中华字库的云输入法 王勇 基础软件国家工程研究中心
第六章 人体生命活动的调节 人体对外界环境的感知.
芹菜 英语051班 9号 黄秋迎 概论:芹菜是常用蔬菜之一,既可热炒,又能凉拌,深受人们喜爱。近年来诸多研究表明,这是一种具有很好药用价值的植物。 别名:旱芹、样芹菜、药芹、香芹、蒲芹 。 芹菜属于花,芽及茎类。
2012年 学生党支部书记工作交流 大连理工大学 建工学部 孟秀英
北京市职业技能鉴定管理中心试题管理科.
完善固定资产加速折旧 企业所得税政策.
2014吉林市卫生局事业单位招聘153名工作人员公告解读
各類所得扣繳法令 與申報實務 財政部北區國稅局桃園分局 103年9月25日
初級游泳教學.
爱国卫生工作的持续发展 区爱卫办 俞贞龙.
第八章 数学活动 方程组图象解法和实际应用
本课内容提要 一、汇率的含义 二、汇率变化与币值的关系 三、汇率变化的影响. 本课内容提要 一、汇率的含义 二、汇率变化与币值的关系 三、汇率变化的影响.
2011计算机类教研活动 陈国久.
精品开放课程的 建设与应用 谢幼如 教授 广东省高校教育技术中心 华南师范大学教育信息技术学院
Foundations of Computer Science
食品添加剂生产许可情况介绍 江苏省食品药品监督管理局 彭弘雷 2014年12月
IT原理与应用(1)-电脑系统 IT Principles and Applications (1) - Computer System
教育部技職司 北區:2015年10月12日下午 南區:2015年10月16日下午
第11章 海量信息存储 主讲:刘方明 副教授 华中科技大学计算机学院
云梯的多namenode和跨机房之路
HADOOP的高能物理分析平台 孙功星 高能物理研究所/计算中心
数据采集与Hadoop框架 报告人:黄文君 导 师:王华忠 BEA Confidential.
發展東華特色課程 期末成果發表 呂進瑞 國立東華大學財金系.
一种基于Hadoop的视频大数据分布式解码方法 冯强
報告人:王月杏 行動電話 台南市 九十九年度電腦維運相關事宜 報告人:王月杏 行動電話
99年台南市中小學電腦維運 --招標結果暨配發說明
3.1主板的组成 3.2主板分类 3.3主板的选购 3.4主流主板芯片组技术参数
第3章 分布式文件系统HDFS (PPT版本号:2017年2月版本)
分布式系统中的关键概念及Hadoop的起源、架构、搭建
第2章 大数据处理架构Hadoop (PPT版本号:2017年2月版本)
快速学习环境搭建 安装前预备工作(Linux相关配置) 实操演示(hadoop、hbase为例) 总结&练习题(课后练练手)
99(1)義守大學工讀職場技能精進訓練班 資訊工程系 林義隆 老師
Hadoop平台使用 计算中心
CHAPTER 6 認識MapReduce.
Cloud Computing(雲端運算) 技術的現況與應用
基于大数据的物流资源整合 福建师范大学协和学院 沈庆琼.
1-1-1作業系統的功能 提供使用者操作介面 提供程式執行環境 控制輸入\輸出程序 分配系統資源 管理與維護磁碟中的檔案
计算机组装、维修及 实训教程 第15章 微机硬件的组装 2018年12月25日星期二.
和諧社區資訊服務推廣計畫 -軟體雲端社區 資訊研習營
作業系統 (Operating System)
电脑配置单1 配件名称 型号 价格(元) CPU AMD双核速龙4000+(三年原盒) 510 散热器 盒装自带 -- 主板
校 園 雲端輸出管理系統 新印科技股份有限公司 聯絡人:伍宏一 電 話: /
基于大数据平台数据管理研究 何家乐 2013年7月 中国科学院高能物理研究所.
应用型本科院校大数据专业 实践教学环境改革与探索
Unit 05 雲端分散式Hadoop實驗 -I M. S. Jian
微机原理与接口技术 ——第三章 80x86微处理器 西安邮电大学 计算机学院 范琳.
密级: 亿赞普Hadoop应用浅析 IZP 肖燕京.
Presentation transcript:

實現雲端運算 Hadoop HDFS 磁碟及記憶體之即時分級服務 輔仁大學 資訊工程研究所 指導老師:葉佐任 博士 研究生:孫逸峰

Outline Introduction Background Design and Implementation Experiment Future Work Conclusion

Introduction (1) CPU與硬碟效能上的差距。 雲端系統中執行程式的效能瓶頸。 提升雲端系統中程式的執行I/O優先權,縮短I/O優先權程式執行時間。 結合作業系統核心(kernel)與Hadoop,發展具有I/O優先權機制的雲端環境。

Linux Operating System Introduction (2) Hadoop Linux Operating System Hardware User Interface MapReduce  Hadoop Distributed File System (HDFS)

Background (1) 讀取HDFS檔案流程 Hadoop Hadoop客戶端 Namenode Datanode1 Namenode,我要讀取123.txt 請至Datanode2中第5~10的區塊讀取 Hadoop客戶端 Namenode 5 6 7 8 9 10 Datanode1 Datanode2 Datanode3

Background (2) 寫入檔案至HDFS流程 Hadoop Hadoop客戶端 Namenode Datanode1 Namenode,我要寫入456.txt Datanode1,我要寫入456.txt 請寫入至Datanode1中 456.txt 1 2 3 4 Hadoop客戶端 Namenode 1 2 3 4 1 2 3 4 Datanode1 Datanode2 Datanode3

Background (3) JobTracker分配MapReduce工作流程 Datanode1 (Tasktracker1) Namenode (JobTracker) Datanode2 (TaskTracker2) job1 1 2 3 4 5 6 Datanode3 (TaskTracker3) job2 7 8 9 6 10 11 12

Background (4) Completely Fair Queuing (CFQ)為Linux預設使用的磁碟排程器。 PCFQ為在CFQ磁碟排程器中加入優先權的研究。

Design and Implementation (1) 研究設計重點部分: - 修改Hadoop中HDFS運作機制。 - 於kernel中使用PCFQ磁碟排程器,並將 記憶體置換機制加入優先權概念。 - 提供使用者執行I/O優先權的介面。

Design and Implementation (2) Namenode建立優先權名單,並管控使用者能否執行I/O優先權指令的權力。

Design and Implementation (3) 客戶端成功申請I/O優先權後,可使用sethigh指令提升程式的I/O優先權。 sethigh指令提高程式I/O優先權範例: 客戶端修改socket封包內容並送往給Datanode sethigh hadoop fs –get source-file destination-file

Design and Implementation (4) 客戶端發送讀取HDFS檔案的socket封包內容 - passpriority為1代表具有I/O優先權,為0則沒有。

Design and Implementation (5) 客戶端發送寫入HDFS檔案的socket封包內容 - passpriority為1代表具有I/O優先權,為0則沒有。

Design and Implementation (6) Datanode接收工作要求封包,將檢查封包中passpriority欄位值。 詢問Namenode此封包的發送者是否為合法的I/O優先權使用者。 Namenode若回傳True,Datanode則告知PCFQ磁碟排程器此封包要求為具有I/O優先權。

Experiment (1) 實驗環境 Hadoop環境中有一台Namenode與三台Datanode Software Hardware Ubuntu 12.04 LTS with kernel 2.6.33.3 Hadoop 1.2.1 Hardware Namenode: CPU: Intel Core i5-2400S 2.50GHz RAM: 4GB DDR3 Hard Disk: SATA3 500GB 7200rpm

Experiment (2) 實驗環境 Hardware Datanode: CPU: Intel Core 2 Duo E8400 3.00GHz RAM: 2GB DDR2 Hard Disk: SATA3 500GB 7200rpm 網路設備: Gigabit switch with Cat5e network wire

Experiment (3) 實驗設計 - 模擬一個忙碌的Hadoop環境,同時執行 多個程式,並分別執行以下實驗。 - TestDFSIO - TeraSort - HDFS讀寫檔案程式

Experiment (4) 實驗設計 - 在以下三種情形中進行實驗數據比較

Experiment (5) 設定TestDFSIO(w)為I/O優先權程式

Experiment (6) 設定TestDFSIO(r)為I/O優先權程式

Experiment (7) 設定Terasort為I/O優先權程式(1)

Experiment (8) 討論Terasort提升效率不明顯之原因: - Terasort為CPU-bound的工作

Experiment (9) 設定Terasort為I/O優先權程式(2)

Experiment (10) 設定Terasort為I/O優先權程式(3)

Experiment (11) 權程式執行效率之原因: 全為執行MapReduce程式可提升具有I/O優先 MapReduce程式須經由JobTracker排班分配工作 具有I/O優先權的程式能提早將MapReduce程式所需要的檔案資料傳至HDFS中 比其它無I/O優先權程式更早被JobTracker分配工作給TaskTracker執行。

Experiment (12) 設定讀取檔案程式READ10G_1為I/O優先權程式

Experiment (13) 設定讀取檔案程式WRITE10G_1為I/O優先權程式

Experiment (14) 設定READ10G_1、 READ10G_2、 READ10G_3為I/O優先權程式

Experiment (15) 設定READ10G_1、 READ10G_2、 WRITE10G_1為I/O優先權程式

Experiment (16) 設定READ10G_1、 WRITE10G_1、 WRITE10G_2為I/O優先權程式

Experiment (17) 設定WRITE10G_1、 WRITE10G_2、 WRITE10G_3為I/O優先權程式

Experiment (18) 設定READ10G_1為I/O優先權程式(加入MapReduce工作一起執行)

Experiment (19) 設定WRITE10G_1為I/O優先權程式(加入MapReduce工作一起執行)

Future Work Hadoop部分: - 結合JobTracker的工作排班機制 作業系統部分: - 結合CPU優先權機制 - 結合磁碟NCQ指令加入優先權的概念

Conclusion Hadoop HDFS中加入I/O優先權機制,能有效提升具有I/O優先權程式的執行效能。 Hadoop中新增處理I/O優先權的機制後,在只執行一般程式下,幾乎不會影響執行效率。

Thank you

補充資料 (1) HDFS讀取檔案流程:

補充資料 (2) HDFS寫入檔案流程:

補充資料 (3) Linux kernel 原始記憶體置換機制:

補充資料 (4) Linux kernel 優先權頁面記憶體置換機制:

補充資料 (5) I/O優先權傳遞流程: