Qi Huang 黄琦, Ken Birman, Robbert van Renesse ( 康奈尔 ), Wyatt Lloyd ( 普林斯顿, Facebook), Sanjeev Kumar, Harry C. Li (Facebook) Facebook 照片缓存分析.

Slides:



Advertisements
Similar presentations
我的 x 檔案 張春桂 ( 阿桂 ). 我的基本資料  破蛋日 :2000 年 9 月 7 日  星座 : 處女 血型 : 未知  興趣 : 敬請期待第 6 頁  身高 :160 體重 : 比你重就對了  性別 : ㄜ ~~ 當然是男的摟  我的偶像 : 我自己  如果臂力強得化可以跟我比腕力喔.
Advertisements

高中新课程思想政治(必 修 1 、 2 )的教学体会 北京师大二附中 李文燕 2008 年西城新课程教师培训的讲稿.
《饲料分析与质量检测技术》 说课 主讲教师:管建慧. 课程名称: 《饲料分析与饲料质量检测技术 》 课程编码:
1 認識創業之財務 ( 資金 ) 及稅務問題 講師 : 蘇炳章 日期 : 92 年 8 月 12 日.
2009/12/211 商務科技管理系 實 務 專 題 報 告 辦桌非難事 學生: 施雅雯 ( ) 張敬芝 ( ) 葉明臻 ( ) 黃怡琅 ( )
第八章 土地行政管理.
海洋教育:教科書、教師與教學 第七至十章導讀 宏仁國中 林珮瑜
「互联网金融2.0时代」与房地产的融合 广州互联网金融协会会长、广州e贷总裁 方颂.
企业会计学(三) 人大版本 吕 昌.
成语乐园 成语乐园 执教老师:李道梅.
高齡自主學習團體終身學習試辦計畫經費核銷
设想有一天你身处这样的困境: 你该怎么办?
劳动关系法务-实操篇 规章制度修审与员工手册撰写.
詹天佑.
據點考核與評鑑 報告人:臺南市政府 照顧服務管理中心.
北师大版义务教育课程标准实验教科书 七年级上册讲义 第17课 先进的科学技术.
特殊族群運動健康訓練(I).
依据教材 全国高等教育自学考试指定教材 《西方行政学说史》, 竺乾威主编,高等教育出版社。
台北縣98年三鶯區語文研習 --建國國小 修辭與標點符號 福和國中廖惠貞
正 信 讀 書 會 主 持 群 : 姚 永 錩 、 鄭 健 、 陳 淑 珍 佛法的生活應用 2008/07/23.
非法集资典型案例评析 南京师范大学法学院 蔡道通 2016年1月.
专题(二) 交往沟通 掌握技能 命 题 解 读 背 景 材 料 新 题 演 练 考 点 链 接 1.
舊高等農林學校作業室.
松竹梅岁寒三友 步入建交 桃李杏村暖一家 迈进职教 活出精彩.
有三件事我很確定: 第一、愛德華是吸血鬼 第二、出於天性,他渴望喝我的血 第三、我無可救藥地愛上他了……
主辦單位:朝陽科技大學休閒事業管理學系 協辦單位:體育室、課外活動組 活動日期:民國100年5月21日 活動地點:朝陽科技大學操場
立體四子棋 研究成員:謝旻諺、 鄭家鈞 指導老師:林屏森老師.
“三步式”网络学习法 《探究与发现》数学网络学习平台介绍
第五讲 国家公务员制度 主要内容: 一、当代中国公务员制度的建立、发展 二、中国公务员制度建设的内涵与特色 三、中西公务员制度改革比较
班級:行流四甲 組員:497D0004何筱瑩 497D0016鄧宜欣 497D0044呂亭儀 497D0056黃 琪 497D0063賴依淩
初中思想品德 规范的教学设计与案例分析.
第八单元第二课第一课时 严守法律 温州四中 蒋莉青.
行政作用法 行政命令.
三創產業學程 學群主持人:袁國榮召集人.
评价是为了促进 学生发展的评价。. 评价是为了促进 学生发展的评价。 语言有温度,字词知冷暖.
高级财务会计.
默写基础知识: 1、家庭是由 关系、 关系或 关系而结合成的亲属生活组织。家里有 ,家中有 。
什么是颈椎病? 颈椎病是指颈椎间盘退行性变,及其继发性椎间关节退行性变所致脊髓、神经、血管损害而表现的相应症状和体征。
郑州市惠济区第六中学 网站推介 姜茂方 2015年1月10日.
俄语字母的发音体系 阅读规则.
第一单元 中国传统文化主流思想的演变.
第六章 社交網路與 虛擬社群 第一節 社會資本 第二節 社交媒體行銷 第三節 社交媒體行銷:讓人知道你 第四節 社交媒體行銷:讓人喜歡你
网络信息资源的开发与设计 主讲教师 罗双兰 广西师范大学教育科学学院.
密室逃脫在教學上的應用 綜合活動領域輔導團 林蓉姿.
公務人員退休法、撫卹法 法制與實務講習 銓敘部退撫司 中華民國99年8月.
學習共同體實施心得分享 新泰國中 報告者 張國振校長.
《傅雷家书》 学 科:语文 年 级:九年级 授课教师:王宁宁.
國立成功大學企業管理研究所.
《体育与健康》说课稿 课题:新兴体育舞蹈 —踢踏舞教学 北师大泉州附中 陈玉慈.
第一節 行政裁量與不確定法律概念 第二節 行政裁量
公務員廉政倫理規範.
本课设置5个环节 一、限时秒杀--5分钟 二、摩拳擦掌--9分钟 三、刀锋相见--20分钟 四、现炒现卖--5分钟 五、相约课后--1分钟.
从中国与联合国的关系演进 看联合国的产生与发展
組 員: 王 新 惠 吳 映 暄 李 盈 慧 廖 香 涵 盧 姵 華 訪談日期:
社會學(一) 空中大學花蓮中心 鍾燕菁
單元 1 政府、公民與社會 政治參與.
A1 “奔腾少年” 学校生活 本刊第001期 本刊共 28 版 出版人:刘雨清 2014年6月1日 星期日 五月初四 甲午年 己巳月 癸卯日.
Application-layer Overlay Networks
第一章 線性方程組.
广州中医药大学研究生 学位论文网络提交方法
101年度經費結報說明 會計室 黃玉露.
FaceBook 粉絲頁建立 主講人:王金鳳.
加減法文字題 國小低年級學生對加減法文字題的瞭解 小組成員 陳育娟 羅珠綾 侯宜孜
飛行器製作與飛行 講師:劉修建.
因果性:一个形而上学的预设 赵敦华 2008年5月.
組員:.
 主講人:楊文明主任委員   106/06/30 中華電信職工福利委員會台北分會業務簡介.
指數、對數函數 數101乙 周文翔 朱哲明 張良聿.
第六章 直接成本法.
李商隐诗两首 锦 瑟 马 嵬 夕阳无限好,只是尽黄昏。.
Presentation transcript:

Qi Huang 黄琦, Ken Birman, Robbert van Renesse ( 康奈尔 ), Wyatt Lloyd ( 普林斯顿, Facebook), Sanjeev Kumar, Harry C. Li (Facebook) Facebook 照片缓存分析

2500 亿 * Facebook 头像 新闻 相册 1 * Internet.org, 2013 年 9 月 后台存储 多级缓存 Full-stack 分析

我们的发现(预览) 2 现有 Stack 的性能 改进的的机会 浏览器缓存非常重要 ( 负担了 65+% 的访问 ) 照片的访问频度分布每层都在变化 更优秀的缓存算法可以显著地提升命中率 (S4LRU) 协同缓存值得一试 (Collaborative distributed cache)

用户 Facebook 照片服务 Stack 3

基于用户的 Browser Cache 用户 Browser Cache Browser Cache 4 本地 访问

用户 Browser Cache Browser Cache ( 上百万 ) 5 基于用户的 Browser Cache

Stack 路由选择 Browser Cache Browser Cache 用户 多级缓存 存储后台 多级缓存 存储后台 Facebook Stack Akamai 内容分发网络 (CDN) 内容分发网络 (CDN) 关注点: Facebook stack 6 ( 上百万 )

地域分布的 Edge Cache (FIFO) Edge Cache Edge Cache ( 数十个 ) Browser Cache Browser Cache 用户 PoP 7 ( 上百万 )

Edge Cache Edge Cache Browser Cache Browser Cache 用户 PoP 8 目标 1. 降低 cross-country 访问延迟 2. 降低数据中心的带宽消耗 ( 数十个 ) ( 上百万 ) 地域分布的 Edge Cache (FIFO)

9 Edge Cache Edge Cache Browser Cache Browser Cache 用户 PoP ( 数十个 ) ( 上百万 )

10 Edge Cache Edge Cache Browser Cache Browser Cache 用户 PoP ( 数十个 ) ( 上百万 ) 地域分布的 Edge Cache (FIFO)

全局 Origin Cache (FIFO) Origin Cache Origin Cache 数据中心 ( 四个 ) 11 Edge Cache Edge Cache Browser Cache Browser Cache 用户 PoP ( 数十个 ) ( 上百万 )

12 目标 1. 最小化 I/O-bound 操作 全局 Origin Cache (FIFO) Origin Cache Origin Cache 数据中心 ( 四个 ) Edge Cache Edge Cache Browser Cache Browser Cache 用户 PoP ( 数十个 ) ( 上百万 )

哈希 (url) 13 全局 Origin Cache (FIFO) Origin Cache Origin Cache 数据中心 ( 四个 ) Edge Cache Edge Cache Browser Cache Browser Cache 用户 PoP ( 数十个 ) ( 上百万 )

14 全局 Origin Cache (FIFO) Origin Cache Origin Cache 数据中心 ( 四个 ) Edge Cache Edge Cache Browser Cache Browser Cache 用户 PoP ( 数十个 ) ( 上百万 )

Haystack 存储后台 Backend (Haystack) 15 Origin Cache Origin Cache 数据中心 ( 四个 ) Edge Cache Edge Cache Browser Cache Browser Cache 用户 PoP ( 数十个 ) ( 上百万 )

我们如何采集数据 ? 16

数据采集 检测范围 Backend (Haystack) Browser Cache Browser Cache Edge Cache Edge Cache Origin Cache Origin Cache PoP 用户数据中心 (Object-based 采样 ) Request-based: 采集 X% 的请求 Object-based: 采集针对 X% object 的请求 17

如何采样 Power-law 18 Object rank

Req-based: 偏向热门内容, 导致分析出的缓存性能虚高 19 Object rank Req-based 如何采样 Power-law

Object-based 20 Object rank Object-based: 即使不热门的内容也可以被采样覆盖到 如何采样 Power-law

Object-based: 即使不热门的内容也可以被采样覆盖到 21 Object rank Object-based 如何采样 Power-law

检测范围 Resizer R 22 数据采集 Backend (Haystack) Browser Cache Browser Cache Edge Cache Edge Cache Origin Cache Origin Cache PoP 用户数据中心

分析 缓存的访问负载效果 (traffic sheltering) 照片的访问频度分布 (popularity distribution) 缓存大小、算法、协作 (collaborative Edge) 文章中 – 照片的时间属性对系统性能的影响 – 照片拥有人的社交属性对系统性能的影响 – 照片请求访问的路由分析 23

负载效果 Backend (Haystack) Browser Cache Browser Cache Edge Cache Edge Cache Origin Cache Origin Cache PoP 用户数据中心 R 24

照片的访问频度分布和对系统的影响 25

访问频度分布 Browser 符合 power-law 分布 26

“ 火爆 Viral” 的照片在 Edge 上依然访问量巨大 27 访问频度分布

分布斜率 (Skewness) 在经过多极缓存后会减少 28

访问频度分布 Backend 符合 stretched exponential 分布 29

绝对访问频度 存储 / 缓存的设计取决于部署的层次位置 30

访问频度分布对缓存的影响 31 High Low M Lowest 每个类别包括 25% 访问

访问频度分布对缓存的影响 Browser 的访问负载逐渐减少 32

访问频度分布对缓存的影响 Edge 除 ”lowest” 组外负载稳定 33

访问频度分布对缓存的影响 Origin 对 “low” 组的贡献最多 34

访问频度分布对缓存的影响 Backend 服务长尾 35

我们如何能够提升缓存性能 ? 36

模拟 重放采集数据 (25% 用来预热缓存 ) 估算当前缓存大小 分析两种命中率 (object-wise, byte-wise) 37

Edge Cache + 缓存空间 选择 San Jose edge ( 高访问量, 中值命中率 ) 38

Edge Cache + 缓存空间 “x” 代表当前缓存尺寸 (59% 命中率 ) 39

Edge Cache + 缓存空间 “ 无限 ” 命中率需要 45x 当前缓存尺寸 40

Edge Cache + 缓存算法 LRU 和 LFU 仅比 FIFO 提高少许 41

S4LRU 42

S4LRU 43

S4LRU 44

S4LRU 45

Edge Cache + 缓存算法 S4LRU 提升最大 46

Edge Cache + 缓存算法 Clairvoyant (Bélády) 意味着还有大量的提升空间 47

Origin Cache S4LRU 对于 Origin 的效用超过 Edge 48

该缓存那种照片 Recency & frequency 导致了 S4LRU 的有效性 照片的年龄、社会属性也会影响性能么 ? 49

照片年龄 50 年轻的照片更加热门,曲线符合 Pareto 分布

照片的社交网络 51 更多的朋友 /followers 给每张照片带来更多的访问

Edge 协作式缓存 52

Edge 的地域覆盖范围 53

Edge 的地域覆盖范围 54

Edge 的地域覆盖范围 55

Edge 的地域覆盖范围 56

Edge 的地域覆盖范围 57 Atlanta 80% 的访问由远程 Edges 服务的

Edge 的地域覆盖范围 58 全局范围内也存在大量的远程访问

Edge 的地域覆盖范围 59

协作式 Edge 60

协作式 Edge “Independent 独立 ” 情况下所有 Edges 的命中率 61

协作式 Edge “Collaborative 协作式 ” Edge 能提高 18% 的命中率 62 Collaborative

相关工作 63 存储系统分析 内容分发分析 Web 访问模式分析 BSD file system (SOSP ’85), Sprite ( SOSP ’91), NT (SOSP ’99), NetApp (SOSP ’11), iBench (SOSP ’11) Cooperative caching (SOSP ’99), CDN vs. P2P (OSDI ’02), P2P (SOSP ’03), CoralCDN (NSDI ’10), Flash crowds (IMC ’11) Zipfian (INFOCOM ’00), Flash crowds (WWW ’02), Modern web traffic (IMC ’11)

结语与贡献 64 量化了现有 stack 内缓存的性能 量化了各层缓存间照片访问频度分布的改变 Recency, frequency, age, social factors 都会影响缓存策略 指出了协作式缓存的潜在作用