淘宝核心系统数据库组 褚霸 http://yufeng.info 2011/06/25 大话SSD 淘宝核心系统数据库组 褚霸 http://yufeng.info 2011/06/25.

Slides:



Advertisements
Similar presentations
我的 x 檔案 張春桂 ( 阿桂 ). 我的基本資料  破蛋日 :2000 年 9 月 7 日  星座 : 處女 血型 : 未知  興趣 : 敬請期待第 6 頁  身高 :160 體重 : 比你重就對了  性別 : ㄜ ~~ 當然是男的摟  我的偶像 : 我自己  如果臂力強得化可以跟我比腕力喔.
Advertisements

高中新课程思想政治(必 修 1 、 2 )的教学体会 北京师大二附中 李文燕 2008 年西城新课程教师培训的讲稿.
《微型计算机技术 及应用》 ( 第 4 版) —— 戴梅萼 史嘉权. 目标 深刻理解 牢固掌握 灵活应用.
《饲料分析与质量检测技术》 说课 主讲教师:管建慧. 课程名称: 《饲料分析与饲料质量检测技术 》 课程编码:
第 3 章操作系统基础 3.1 操作系统概述 3.2 操作系统的功能模块 3.3 典型操作系统概述.
2009/12/211 商務科技管理系 實 務 專 題 報 告 辦桌非難事 學生: 施雅雯 ( ) 張敬芝 ( ) 葉明臻 ( ) 黃怡琅 ( )
云时代的存储技术创新.
计算机组成原理 第三讲 计算机科学与技术学院 舒燕君.
温故知新 问题一:我国科技发展经过怎样的历程? 中华民族在历史上曾创造了辉煌灿烂的文化,世界领先;
成语乐园 成语乐园 执教老师:李道梅.
ThinkCentre M6600t/s 产品介绍 万扬,大客户台式营销 2015年10月.
Bennett Hong For 2012华东架构师大会 Nov 18,2012
開南大學 資訊管理學系 學分學程相關說明.
詹天佑.
北师大版义务教育课程标准实验教科书 七年级上册讲义 第17课 先进的科学技术.
國外差旅費 大家好,我是楊思研, 今天要告訴各位的內容,是關於「國外差旅費」的部分。
精品开放课程的 建设与应用 谢幼如 教授 广东省高校教育技术中心 华南师范大学教育信息技术学院
用來儲存資料的裝置,硬碟、軟碟、光碟、磁帶 具有非揮發性的特性,可以在電源消失時,持續保有資料的完整。
“淡雅浓香 中国风尚” 山东低度浓香白酒整合传播侧记
第5章 多级结构的存储系统 5.1 三级结构存储系统概述 主存储器 虚拟存储器 CPU 高速缓存 三级结构的存储系统.
华为2路机架服务器产品售前培训 作者:陈星颖/
主辦單位:朝陽科技大學休閒事業管理學系 協辦單位:體育室、課外活動組 活動日期:民國100年5月21日 活動地點:朝陽科技大學操場
組裝電腦DIY 前言:提供基礎的電腦零件組裝教學,對於個人電 腦零件有基本的認識、並有組裝零件使電腦能運 行的能力、能親手 升級自己想要的零件、及基 本的簡易判斷無法開機的原因;最後並提供實做,親手DIY將電腦組裝起來並安裝作業系統。 對象:對電腦組裝沒概念或一知半解者;想要能自己解決電腦無法開機,或是能自己升級想要的專屬電腦配備;可以當家庭的電腦醫生不想電腦一碰到問題就叫修花錢者;自己是電腦軟體方面的工作者,想要增加自己的競爭實力.
2013华东数据库技术大会 人人网的SNS数据库架构与设计艺术 周彦伟
立體四子棋 研究成員:謝旻諺、 鄭家鈞 指導老師:林屏森老師.
“三步式”网络学习法 《探究与发现》数学网络学习平台介绍
PB级科研数据集的管理和应用 曙光信息产业(北京)有限公司.
第一章 计算机基础知识 计算机的发展简史 1 计算机软件系统 6 计算机的定义和分类 2 微型计算机的组成 7 计算机的特点和用途 3
製程升級 產能躍進 311地震對全球記憶體產業影響有限
第二章 项目一:企业厂区与车间平面设计 1.
初中思想品德 规范的教学设计与案例分析.
关于职教发展的几个理念 上海市教育科学研究院 周亚弟.
第三节 渐开线圆柱齿轮精度等级及应用.
信息科学与工程学院计算机科学系 2006年9月—2007年1月
三創產業學程 學群主持人:袁國榮召集人.
淘宝 商品库MySQL优化实践 QCon 2011 Beijing
第2章:企業組織 張緯良 世新大學資訊管理系.
宝德 ---智能IT基础架构 宝德科技集团股份有限公司 解决方案部.
SA120/SAS112/NAS产品介绍 2013 LENOVO INTERNAL. All rights reserved.
第8章 机床操作 主讲:臧红彬 博士.
尋找春天的詩蹤 世界書香日全國推廣閱讀記者會
计算机与信息技术应用基础 徐东雨 计算机中心
IC卡基础知识.
《体育与健康》说课稿 课题:新兴体育舞蹈 —踢踏舞教学 北师大泉州附中 陈玉慈.
武汉测地所 现场集群环境介绍 TC3600刀片服务器产品 扩展方案讨论.
報告人:王月杏 行動電話 台南市 九十九年度電腦維運相關事宜 報告人:王月杏 行動電話
99年台南市中小學電腦維運 --招標結果暨配發說明
3.1主板的组成 3.2主板分类 3.3主板的选购 3.4主流主板芯片组技术参数
2006年10月 面向数据处理的高端系统 胡雷钧 浪潮公司.
資策會 南區資訊處 教育訓練中心 吳建興 個人電腦組裝 PC DIY 資策會 南區資訊處 教育訓練中心 吳建興
主讲教师:唐大仕 第5讲 计算机硬件 主讲教师:唐大仕
第 5 章 主機板探索.
TPC-C标准及实验平台.
SLW-MG 內接式固態硬碟機 商品介紹.
三星450R4V-X03 宣传片 制作人:陈爱婕 目录.
淘宝核心系统数据库组 余锋 利用新硬件提升数据库性能 淘宝核心系统数据库组 余锋
Flash摺紙藝術教學 這是韓國人製作的摺紙教學網站,運用flash講解每個步驟,非常實用,不妨多學習利用,也可播放步驟加上解說讓幼兒跟著做。 僅用於自己教學非營利用圖以尊重著作版權。
第4章 電腦的組成與架構 4-1 電腦的基本架構 4-2 個人電腦的主機.
存储设备介绍 广州创龙电子科技有限公司 Guangzhou Tronlong Electronic Technology Co., Ltd.
Pure Storage設備 雲端桌面系統 評估測試與經驗分享
信息存储与管理 国家天文台 (科技处)信息与计算中心.
第2章 電腦硬體的架構及功能.
第2章 電腦硬體知識 2-1 電腦基本硬體結構 2-2 電腦的週邊設備 2-3 電腦的操作與保養
笔记本内部存在静电详解 电脑常见问题解决 电源指示灯
織物的認識 演示者:陳明玲 美容科:家政概論.
作業系統 第三章 作業系統結構.
微机原理与接口技术 ——第三章 80x86微处理器 西安邮电大学 计算机学院 范琳.
微机原理与接口技术 课程性质:专业技术必修课程 课程的特点:偏重硬件,软硬件结合 先修课程:导论、数字逻辑、组成原理、汇编语言等
FaceBook 粉絲頁建立 主講人:王金鳳.
電腦相關新技術規格
Presentation transcript:

淘宝核心系统数据库组 褚霸 http://yufeng.info 2011/06/25 大话SSD 淘宝核心系统数据库组 褚霸 http://yufeng.info 2011/06/25

Agenda 初见 相识 相知 相爱  

存储设备IOPS演变史 设备 IOPS 接口 7200 RPM SATA drives ~90 IOPS SATA II 15k RPM SCSI drives ~180 IOPS SAS Intel X25-M G2 (MLC) ~8,600 IOPS ioDrive, a PCI-Express card with Flash with Flash 140,000 Read IOPS, 135,000 Write IOPS  PCIe Fusion-io ioDrive Octal 1,180,000+ Random Read/Write IOPS

存储设备价格对照 设备 价格/每GB SATA 7200转 0.1 USD SAS 10000转 0.4 USD Intel X25-M 160G * USD FusionIO  iodrive MLC 320G Virident  tachion SLC 400G

淘宝使用案例 CDN  IC库  TC主库 TC读库  Oceanbase Vstore 图像搜索 Tair ...

Agenda 初见 相识 相知 相爱

PCI-E/SATA接口

Intel X25-M/SATA

FusionIO iodrive/PCI-E

Virident tachion/PCI-E

SSD写入如何发生的呢?

背景知识1:Nand芯片擦写次数 Generation SLC MLC eMLC 2x 100,000 2,500 3x 5,000 35,000 5x 10,000

背景知识2:写放大倍数 写放大倍数的定义:SSD物理写字节数/应用逻辑写字节数   放大倍数越大,说明: 设备不够好 我们没用好 寿命杀手

Intel X25/M Nand内部布局

数据如何写入SSD(1)

数据如何写入SSD(2)

数据如何写入SSD(3)

数据如何写入SSD(4)

垃圾收集导致IO性能下降

Agenda 初见 相识 相知 相爱

适用环境 对IOPS要求高,离散读多。 离散写多。 需要低延迟。  作为后备内存。 作为L2 Cache 。

对程序员的影响 SSD=/=磁盘,传统软件基于机械硬盘设计。 IOPS不再是问题,如果利用好是问题。 离散读写非常快(3个数量级),顺序读写没优势。 读写延迟时间小。 读不消耗寿命,写消耗,越小的数据写越不合算。  同一个位置写,由于均衡算法的存在,不会磨损芯片的同一位置。 尽量合并写。 

对程序员的影响(续) SSD IO吞吐量1.XG/s, 内存是4-6G/s, 可看作是更大的内存? MMAP做后备内存,和jemalloc这样的内存分配器配合。 异步IO, 保证IO请求队列深度。 对SSD的特性进行算法优化。 fsync能力是数据类应用天花板。  

使用SSD通常要考虑的问题

Agenda 初见 相识 相知 播种

选择 多线程和IOPS 文件系统的选择 IO块大小 SLC还是MLC 写放大倍数 数据安全性 驱动对应用的影响 抖动/延迟 文件系统的选择  IO块大小 SLC还是MLC 写放大倍数 数据安全性 驱动对应用的影响 抖动/延迟 L2 Cache方案  

离散读性能/线程数目

离散写性能/线程数目

文件系统的影响

IO块大小的影响

Nand: MLC还是SLC

写放大倍数和寿命 数据库典型的应用: Intel X25-M: 5-8倍 FusionIO iodrive: 2-3倍   数据库典型的应用: Intel X25-M:   5-8倍 FusionIO iodrive: 2-3倍 可以透过ssd设备提供的监控程序(如smartctl)来获取这些参数 . 寿命: Intel X25-M: 200T FusionIo iodrive 320G: 4P

数据安全性 数据校验: ECC校验 Raid冗余 Intel X25-M支持硬件raid卡,FusionIO 只能做软raid 掉电保护: 数据校验:  ECC校验 Raid冗余 Intel X25-M支持硬件raid卡,FusionIO 只能做软raid   掉电保护:  大电容保护 日志系统 数据恢复时间: FusionIO最多10分钟左右(内部日志系统)

驱动对应用的影响 Sata接口:标准Linux驱动,驱动开销很小 PCI-E接口:每个厂家驱动不同,对CPU和内存的消耗可能会非常大。 FusionIO在峰值的时候可能会占用1-2G内存, 最多1x0%CPU, Virident由于板载处理器CPU消耗比较小。 中断开销: 中断多的时候是否可以考虑均衡

抖动和延迟 由于数据整理的不可避免性,抖动也是不可避免的。 Intel:   Intel:     脏块回收做的不是很好,在使用过程中,数据写入多的情况下抖动会很厉害。 FusionIO:     相对好些,但是也会有轻微抖动。 可以通过加大reserve容量(通常默认20%)来大大缓解这个问题。 延迟时间可能会达到1ms.

SSD作为L2Cache方案 好处: 低成本,高性能 对应用透明 可选方案: Facebook FlashCache   可选方案: Facebook FlashCache FusionIO DirectCache 文件系统  存在问题: 性能损失 单点故障 数据热点问题

Agenda 初见 相识 相知 相爱

交流时间   谢谢大家! SSD未来会很快普及, 我们做好相爱的准备了吗?