大数据应用人才培养系列教材 大数据系统运维 刘 鹏 张 燕 总主编 姜才康 主编 陶建辉 副主编.

Slides:



Advertisements
Similar presentations
大数据基础技术和应用. 大纲 大数据概述 大数据基础技术 工程技术 策略技术 典型应用 我们处于数据爆炸的时代 数据库 文字记录 照片 线下数据信息化 网页数据 用户行为记录 数字图像 互联网 - 移动互联网 设备监控 智能家居 摄像头 传感器 地球上至今总共的数据量: 在 2006 年,个人用户才刚刚迈.
Advertisements

高级软件工程 复习课.
第120讲:Hadoop的MapReduce和Yarn的配置实战详解
LSF系统介绍 张焕杰 中国科学技术大学网络信息中心
大數據的學習路線 目前做不到的:機率性太高的(博奕) 大數據的核心:預測 預測來自於:分析及樣本 樣本的產生及收集 樣本的儲存 樣本的處理
E-Mapreduce培训系列 基本介绍.
巨量資料平台: Hadoop的生態系.
为教师开展大数据课程教学提供全方位、一站式服务
转正述职报告 乐恩公司 史航
發展東華特色課程 期末成果發表 呂進瑞 國立東華大學財金系.
Oracle数据库 Oracle 子程序.
基于hadoop与hive的大数据分析体系构建
YARN & MapReduce 2.0 Boyu Diao
基于R和pentaho的全套开源BI平台的实现
分布式系统中的关键概念及Hadoop的起源、架构、搭建
LSF系统介绍 张焕杰 中国科学技术大学网络信息中心
云计算之分布式计算.
SVN的基本概念 柳峰
第九讲 Hadoop架构再探讨 (2016春季学期)
Spark在智慧图书馆建设中的应用探索 2017年12月22日.
Chinese Virtual Observatory
Hadoop平台與應用規劃實作 報告者:劉育維.
从TDW-Hive到TDW-SparkSQL
SVN服务器的搭建(Windows) 柳峰
基于大数据的物流资源整合 福建师范大学协和学院 沈庆琼.
Homework 1(上交时间:10月14号) 倒排索引.
第11章:一些著名开源软件介绍 第12章:服务安装和配置 本章教学目标: 了解当前一些应用最广泛的开源软件项目 搭建一个网站服务器
《Spark编程基础》 《 Spark编程基础》课程介绍 (PPT版本号:2018年2月)
大数据管理技术 --NoSQL数据库 HBase 陈 辉 大数据分析技术.
晟元大数据云平台 食品安全云大数据云平台 2017年4月 北京晟元亿讯科技有限公司.
Windows网络操作系统管理 ——Windows Server 2008 R2.
第十章 IDL访问数据库 10.1 数据库与数据库访问 1、数据库 数据库中数据的组织由低到高分为四级:字段、记录、表、数据库四种。
软件工程基础 云计算概论 刘 驰.
DevDays ’99 The aim of this mission is knowledge..
基于大数据平台数据管理研究 何家乐 2013年7月 中国科学院高能物理研究所.
三:基于Eclipse的集成开发环境搭建与使用
C语言程序设计 主讲教师:陆幼利.
微机系统的组成.
VisComposer 2019/4/17.
Cassandra应用及高性能客户端 董亚军 来自Newegg-NESC.
2019/4/26 关注NE官方微信,获取更多服务.
Web安全基础教程
JSP实用教程 清华大学出版社 第2章 JSP运行环境和开发环境 教学目标 教学重点 教学过程 2019年5月7日.
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
软件服务导论 刘 驰 教授 博士生导师 北京理工大学计算机学院 副院长
Google的云计算 分布式锁服务Chubby.
基于列存储的RDF数据管理 朱敏
C++语言程序设计 C++语言程序设计 第一章 C++语言概述 第十一组 C++语言程序设计.
Chinese Virtual Observatory
大数据应用人才培养系列教材 大数据实践 刘 鹏 张 燕 总主编 袁晓东 主编 黄必栋 副主编.
大数据应用人才培养系列教材 Python语言 刘 鹏 张 燕 总主编 李肖俊 主编 刘 河 钟 涛 副主编.
大数据应用人才培养系列教材 R 语言 刘 鹏 张 燕 总主编 程显毅 主编 刘颖 朱倩 副主编.
大数据应用人才培养系列教材 R 语言 刘 鹏 张 燕 总主编 程显毅 主编 刘颖 朱倩 副主编.
大数据应用人才培养系列教材 大数据导论 刘 鹏 张 燕 总主编 付 雯 主编 陈 甫 李法平 副主编.
大数据应用人才培养系列教材 Python语言 刘 鹏 张 燕 总主编 李肖俊 主编 刘 河 钟 涛 副主编.
大数据应用人才培养系列教材 大数据实践 刘 鹏 张 燕 总主编 袁晓东 主编 黄必栋 副主编.
大数据应用人才培养系列教材 大数据实践 刘 鹏 张 燕 总主编 袁晓东 主编 黄必栋 副主编.
FVX1100介绍 法视特(上海)图像科技有限公司 施 俊.
大数据应用人才培养系列教材 R 语言 刘 鹏 张 燕 总主编 程显毅 主编 刘颖 朱倩 副主编.
高级大数据人才培养丛书之一,大数据挖掘技术与应用
大数据应用人才培养系列教材 数据挖掘基础 刘 鹏 张 燕 总主编 陶建辉 主编 姜才康 副主编.
大数据应用人才培养系列教材 大数据实践 刘 鹏 张 燕 总主编 袁晓东 主编 黄必栋 副主编.
大数据应用人才培养系列教材 数据挖掘基础 刘 鹏 张 燕 总主编 陶建辉 主编 姜才康 副主编.
大数据应用人才培养系列教材 大数据系统运维 刘 鹏 张 燕 总主编 姜才康 主编 陶建辉 副主编.
《大数据导论(通识课版)》 第4章 大数据应用 (PPT版本号:2019年秋季学期)
《大数据导论(通识课版)》 第6章 大数据思维 (PPT版本号:2019年秋季学期)
《大数据导论(通识课版)》 教材官网: 第5章 大数据安全 (PPT版本号:2019年秋季学期)
大数据应用人才培养系列教材 数据清洗 刘 鹏 张 燕 总主编 李法平 主编 陈潇潇 副主编.
百万行、千万行数据查询教程 老黄牛.
大数据应用人才培养系列教材 大数据系统运维 刘 鹏 张 燕 总主编 姜才康 主编 陶建辉 副主编.
Presentation transcript:

大数据应用人才培养系列教材 大数据系统运维 刘 鹏 张 燕 总主编 姜才康 主编 陶建辉 副主编

第八章 升级管理 8.1 Hadoop升级管理 8.2 Spark升级管理 8.3 Hive SQL升级管理 大数据应用人才培养系列教材 第八章 升级管理 8.1 Hadoop升级管理 8.2 Spark升级管理 8.3 Hive SQL升级管理 8.4 ZooKeeper升级管理 习题

8.1 Hadoop升级管理 Hadoop升级风险 第八章 升级管理 Hadoop升级风险 Hadoop升级最主要是HDFS的升级,HDFS的升级是否成功,才是升级的关键,如果升级出现数据丢失,则其他升级就变的毫无意义。

8.1 Hadoop升级管理 HDFS的数据和元数据升级 第八章 升级管理 HDFS的数据和元数据升级 HDFS是一种分布式文件系统层,可对集群节点间的存储和复制进行协调。HDFS确保了无法避免的节点故障发生后数据依然可用,可将其用作数据来源,可用于存储中间态的处理结果,并可存储计算的最终结果。 升级HDFS花费的时间不长,就是和启动集群的时间要多2-3倍的时间,升级丢失数据的风险几乎没有。

8.1 Hadoop升级管理 第八章 升级管理 YARN升级配置 YARN是Yet Another Resource Negotiator(另一个资源管理器)的缩写,可充当Hadoop堆栈的集群协调组件。该组件负责协调并管理底层资源和调度作业的运行。通过充当集群资源的接口,YARN使得用户能在Hadoop集群中使用比以往的迭代方式运行更多类型的工作负载。 由于任务计算都是使用Hive,所以YARN的升级很简单,只是启动yarn就行了。唯一要注意的是,从MapReduce升级到YARN,资源分配方式变化了,所以要根据自己的生产环境修改相关的资源配置。

第八章 升级管理 8.1 Hadoop升级管理 8.2 Spark升级管理 8.3 Hive SQL升级管理 大数据应用人才培养系列教材 第八章 升级管理 8.1 Hadoop升级管理 8.2 Spark升级管理 8.3 Hive SQL升级管理 8.4 ZooKeeper升级管理 习题

8.2 Spark升级管理 Spark特性 支持比Map和Reduce更多的函数。 优化任意操作算子图(operator graphs)。 第八章 升级管理 Spark特性 支持比Map和Reduce更多的函数。 优化任意操作算子图(operator graphs)。 可以帮助优化整体数据处理流程的大数据查询的延迟计算。 提供简明、一致的Scala,Java和Python API。 提供交互式Scala和Python Shell。目前暂不支持Java。

8.2 Spark升级管理 01 02 03 04 Spark生态系统 Spark Streaming Spark SQL 第八章 升级管理 Spark生态系统 Spark Streaming 01 Spark SQL 02 Spark MLlib 03 Spark GraphX 04

第八章 升级管理 8.1 Hadoop升级管理 8.2 Spark升级管理 8.3 Hive SQL升级管理 大数据应用人才培养系列教材 第八章 升级管理 8.1 Hadoop升级管理 8.2 Spark升级管理 8.3 Hive SQL升级管理 8.4 ZooKeeper升级管理 习题

8.3 Hive SQL升级管理 用户接口 元数据存储 解释器、编译器、优化器、执行器 Hadoop Hive SQL体系结构 第八章 升级管理 Hive SQL体系结构 用户接口 用户接口主要有三个:CLI,Client 和 WUI。 元数据存储 Hive 将元数据存储在数据库中,如 mysql、derby。Hive 中的元数据包括表的名字,表的列和分区及其属性,表的属性(是否为外部表等),表的数据所在目录等。 解释器、编译器、优化器、执行器 解释器、编译器、优化器完成 HQL 查询语句从词法分析、语法分析、编译、优化以及查询计划的生成。生成的查询计划存储在 HDFS 中,并在随后由 MapReduce 调用执行。 Hadoop Hive 的数据存储在 HDFS 中,大部分的查询由 MapReduce 完成(包含 * 的查询,比如 select * from tbl 不会生成 MapReduce 任务)。

01 02 03 04 8.3 Hive SQL升级管理 安装配置 安装需要的环境 安装打包好的Hive 编译Hive编码 运行Hive 第八章 升级管理 安装配置 01 安装需要的环境 02 安装打包好的Hive 03 编译Hive编码 04 运行Hive

第八章 升级管理 8.1 Hadoop升级管理 8.2 Spark升级管理 8.3 Hive SQL升级管理 大数据应用人才培养系列教材 第八章 升级管理 8.1 Hadoop升级管理 8.2 Spark升级管理 8.3 Hive SQL升级管理 8.4 ZooKeeper升级管理 习题

8.4 ZooKeeper升级管理 01 选举Leader。 02 同步数据。 ZooKeeper的基本运转流程 03 选举标准一致。 04 第八章 升级管理 01 选举Leader。 02 同步数据。 ZooKeeper的基本运转流程 03 选举标准一致。 04 Leader具有最高执行权限。 05 集群中大多数机器得到相应并选出Leader。

01 02 8.4 ZooKeeper升级管理 ZooKeeper升级方式 单机模式 集群模式 第八章 升级管理 ZooKeeper升级方式 单机模式 单机安装非常简单,只要获取到Zookeeper的压缩包并解压到某个目录,进行简单配置即可完成。 01 集群模式 Zookeeper 的集群模式的安装和配置也不是很复杂,所要做的就是增加几个配置项。 02

第八章 升级管理 8.1 Hadoop升级管理 8.2 Spark升级管理 8.3 Hive SQL升级管理 大数据应用人才培养系列教材 第八章 升级管理 8.1 Hadoop升级管理 8.2 Spark升级管理 8.3 Hive SQL升级管理 8.4 ZooKeeper升级管理 习题

习题: 1.请简要描述Hadoop的主要特点? 2.请简要描述Spark的主要特点并说明Spark的生态系统。 3.请简要描述Hive Sql的体系结构。

AIRack人工智能实验平台 ——一站式的人工智能实验平台 DeepRack深度学习一体机 ——开箱即用的AI科研平台 BDRack大数据实验平台——一站式的大数据实训平台

云创公众号推荐 刘鹏看未来 云计算头条 中国大数据 深度学习世界 云创大数据订阅号 云创大数据服务号 高校大数据与人工智能 微信号:lpoutlook 云计算头条 微信号:chinacloudnj 中国大数据 微信号:cstorbigdata 深度学习世界 微信号:dl-world 云创大数据订阅号 微信号:cStor_cn 云创大数据服务号 微信号:cstorfw 高校大数据与人工智能 微信号:data_AI

手机APP推荐 我的PM2.5 随时随地准确 查看身边的 PM2.5值 同声译 支持26种语言 互译的实时翻 译软件 我的南京 云创大数据为路 况大数据应用提 供技术支持 科技头条 汇聚前沿资讯 的科技情报站

网站推荐 万物云 智能硬件大数据免费托管平台 环境云 环境大数据开放共享平台

感谢聆听