HBase简介与实践分享 剑英.

Slides:



Advertisements
Similar presentations
我的 x 檔案 張春桂 ( 阿桂 ). 我的基本資料  破蛋日 :2000 年 9 月 7 日  星座 : 處女 血型 : 未知  興趣 : 敬請期待第 6 頁  身高 :160 體重 : 比你重就對了  性別 : ㄜ ~~ 當然是男的摟  我的偶像 : 我自己  如果臂力強得化可以跟我比腕力喔.
Advertisements

Java 技术与应用 数据库应用 ( 第 14 章 ) 西安交大 卫颜俊 2008 年 12 月 电子信箱: QQ: 网站 : /java.
分布式系统 Distributed Systems 第 13 讲 NoSQL Lecture 13 NoSQL
高雄師範大學103學年度教育學程招生準備方向 高師大師培中心 凃金堂
两汉文学及汉代诗歌.
電子商務:數位時代商機‧梁定澎總編輯‧前程文化 出版
狙公 劉基.
天主教善導小學 錦繡中華 --- 專題研習報告比賽 實地考察 福建客家土樓的變與同.
近现代文学概说.
第二組 組長:16葛詠馨 組員:8張庭瑋、14葉映歡 17鄭琇文、37黃世宣
DATE: 14/10/2009 陳威宇 格網技術組 雲端運算相關應用 (Based on Hadoop)
Big Data Ecosystem – Hadoop Distribution
淘宝海量数据产品技术架构 张轩丞(朋春) 淘宝网-数据平台与产品部.
漫 步 現 金 流 現金流,這輩子非得瞭解….
第八讲 基于Hadoop的数据仓库Hive (PPT版本号:2016年4月6日版本)
第六章 資料倉儲與採礦技術 6.1 資料倉儲與採礦定義 6.2 資料採礦之步驟與技術分類 6.3 資料採礦在顧客關係管理之應用
“大云”大数据平台及应用 中国移动通信研究院 郭磊涛 2013年11月.
穆公(朱金清 微博:淘穆公 阿里HBase业务设计实践 穆公(朱金清 微博:淘穆公
主辦單位:朝陽科技大學休閒事業管理學系 協辦單位:體育室、課外活動組 活動日期:民國100年5月21日 活動地點:朝陽科技大學操場
从“阿拉伯之春” 看新媒体的政治传播能力.
第8章 SELECT敘述的基本查詢 8-1 SELECT查詢指令 8-2 SELECT子句 8-3 FROM子句 8-4 WHERE子句
Bilibili的存储实战(bfs) —— 分布式小文件存储.
50个经典面试问答 主讲:卢秀峰.
本周主要有 16 款网页游戏进行了公开测试, 11 款角色扮演类型,4 款战争策略类型,1 款休
BOTNET Detection and Prevention
巨量資料平台: Hadoop的生態系.
个人职业生涯规划.
云梯的多namenode和跨机房之路
数据采集与Hadoop框架 报告人:黄文君 导 师:王华忠 BEA Confidential.
Canal开源产品介绍 taobao.
台灣加油!! 決不放棄!! 加油!! 加油!! 馬英九.
論文心得報告 冷凍二忠 39號 顏酩修.
58同城从MongoDB到MySQL迁移之路
第十八章 沟通的真理.
转正述职报告 乐恩公司 史航
發展東華特色課程 期末成果發表 呂進瑞 國立東華大學財金系.
HBase 簡介 : 資料格式與運作架構  Hubert 范姜-亦思科技.
契約 課程:文書實務與應用 教師:黃湃翔老師.
關聯式資料庫.
第十五章 常見的資料庫管理系統 目的 Oracle 微軟SQL Server 微軟Access MySQL Oracle 應用伺服器
單元 1 政府、公民與社會 政治參與.
Alibaba 数据库高可用架构 Alibaba
建立/修改/刪除資料庫 資料庫組成檔案 建立資料庫: 資料(庫)檔案 交易記錄檔 使用Enterprise Manager工具 自助法:
厦门大学数据库实验室NoSQL系列学习之
吳錦範 國立台東大學圖書館 2009/08/13 台東大學圖書館 創新服務之經驗分享 吳錦範 國立台東大學圖書館 2009/08/13.
王耀聰 陳威宇 國家高速網路與計算中心(NCHC)
基于Hadoop的数据仓库Hive.
巨量資料分析與應用 (1) 楊立偉教授 台大工管系暨商研所 2014 Fall.
Hadoop.
Cloud Computing Google云计算原理.
資料庫系統導論.
奢侈稅成效分析與房市未來發展 吳中書 中華經濟研究院 第十九屆亞太財務經濟會計及管理會議 ~07.09.
MySQL 結構化查詢語言 MySQL.
第4章(1) 空间数据库 —数据库理论基础 北京建筑工程学院 王文宇.
大数据介绍及应用案例分享 2016年7月 华信咨询设计研究院有限公司.
愛惜生命.
1.源起 2.目標 3.為什麼要做這個題目 4.他的遊戲族群與年紀 5.它的視覺表現 6.目前獲利方式 7.結論 8.遊戲可修正處
味精的妙用 班別:4A 姓名:盧芷桐(23),吳宝怡 (25),余心 穎,(26).
珊瑚白化和全球化之關係 作者:仲士豪、姜少強.
組員:4960P013 陳佳琪 4960P018 柯琬婷 4960P054 林家瑜 指導老師: 陳碩珮 老師
出生於:1866年11月12日 是中國的革命家,第一任中華民國臨時大總統
8 SELECT敘述的基本查詢 8-1 SELECT查詢指令 8-2 SELECT子句 8-3 FROM子句 8-4 WHERE子句
FaceBook 粉絲頁建立 主講人:王金鳳.
如何成立公司 組員:洪鼎鈞 謝宜龍 林永貴 曾賴志行.
如何使用均一教育平台: 給家長、老師與家教看的說明
薏仁=益人 20510李佶秝.
行政救濟實務 -行政訴訟 楊東連 行政救濟實務.
學校:德明財經科技大學 系別/班級:國貿系四年甲班 姓名:彭咨錞 2010/08/26
大数据应用人才培养系列教材 大数据实践 刘 鹏 张 燕 总主编 袁晓东 主编 黄必栋 副主编.
電腦病毒簡介 周承復 Date: 11/12/2002.
Presentation transcript:

HBase简介与实践分享 剑英

About me 剑英(谭颖亮) 就职于淘宝网 目前负责淘宝数据平台与产品部--基础研发,专注于分布式数据存储计算同步平台的建设

Simple Introduce Yet Another NoSQL Bigtable implementation Primary Contributors: Yahoo!,Facebook,Cloudera

Basic Concepts Table in HBase Example Schema: TableName & Column Family Name ; value is stored in column with version as byte[]; Example Column Family Column Label Column Qualifier CL // Schema name contact // CL firstname lastname nickname email phone bixuan hao lin bluedavy **@gmail 186****** 158******

Basic Concepts Table in HBase 以Region为单位管理region(startKey,endKey); 每个Column Family单独存储:storeFile; 当某个Column Family累积的大小 > 某阈值时,自动分裂成两个Region; 如何找到某行属于哪个region呢? -ROOT- & .META.

Basic Concepts RegionServer Master Region读写操作的场所; 管理Region的分配; 基于zookeeper来保证HA;

HBase Architecture 图来源于: http://goo.gl/d1T3Q

HBase Features 强一致性 水平伸缩 同一行数据的读写只在同一台regionserver上进行; region的自动分裂以及master的balance; 只用增加datanode机器即可增加容量; 只用增加regionserver机器即可增加读写吞吐量;

HBase Features(Cont.) 行事务 Column Oriented + 三维有序 同一行的列的写入是原子的; Column Oriented + 三维有序 SortedMap(RowKey, List(SortedMap(Column, List(Value,Timestamp)) ) rowKey (ASC) + columnLabel(ASC) + Version (DESC) --> value

HBase Features(Cont.) 支持范围查询 高性能随机写 Scan scan=new Scan(Bytes.toBytes("0"), Bytes.toBytes("20")); 高性能随机写 WAL (Write Ahead Log)

HBase Features(Cont.) 和Hadoop无缝集成 Hadoop分析后的结果可直接写入HBase; 存放在HBase的数据可直接通过Hadoop来进行分析。

Why not? just see users and performance HBase能用于Online场景吗?

HBase Users Facebook Trend Micro Adobe Twitter Yahoo! Messages Realtime analytics for Big Data Trend Micro Adobe Twitter Yahoo!

HBase性能 随机写(K: 200 byte V: 1024 byte) region server机器:12块1T的SATA盘7200rpm,No Raid,24G,Xeon5620 2.4GHz,千兆网卡; Java Heap: 12G

HBase性能(Cont.) 随机写(K: 200 byte V: 1024 byte) avg: 3ms,吞吐量:1w tps/rs

HBase性能(Cont.) 10亿key(1T数据量)随机读,12台rs,cache: 4g/台;

HBase性能(Cont.) 之前的场景,cache全命中的状况: avg: <1ms

HBase不支持的 二级索引; sql/join/跨行跨表等RDBMS特性;

HBase适用场景 摘自:HBase @ Facebook The Technology Behind Messages (and more...)

HBase @ Taobao 已上线的online项目 即将上线的online项目 4个,数据量为70T;

我们的HBase 自动的测试体系 more powerful then YCSB!

我们的HBase(Cont.) 运维体系 运行指标; 快速判断集群健康状况; 帮助分析集群性能。

我们的HBase(Cont.) 改进HBase Table Balance Client put bug Compact优化 Master恢复时间过长

我们的HBase(Cont.) 扩展HBase 支持Server端计算 按Group资源隔离 和优先级控制 group by,avg,sum等 按Group资源隔离 和优先级控制

HBase实践经验 合理设计rowKey & Pre-Sharding 避免仅操作集群中的少数几台机器; 根据数据量、region server数合理pre-sharding。

HBase实践经验(Cont.) 容量影响因素 开启压缩 lzo create table ‘t1’,{NAME => ‘cf1’, COMPRESSION => ‘lzo’}

HBase实践经验(Cont.) 写速度关键因素 Table region分布均衡; 单台region server的region数; hbase.regionserver.handler.count hbase.regionserver.global.memstore.upperLimit hbase.hregion.memstore.block.multiplier hbase.hstore.blockingStoreFiles hbase.hregion.max.filesize

HBase实践经验(Cont.) 读速度关键因素 单台Region Server上的Region数; StoreFile数; bloomfilter; in-memory flag; blockcache设置; hfile.block.cache.size;

HBase实践经验(Cont.) 二级索引 合理使用三维有序 More details pls attend 技术沙龙 冗余 离线

Any Questions