5.5 减少命中时间 容量小、结构简单的Cache 第五章 存储层次

Slides:



Advertisements
Similar presentations
定 格 入 格 破 格 —— 新诗仿写复习训练 仿照下列句子,再把 “ 人生 ” 比喻成 “ 大海 ”“ 天空 ” , 造两个句子。 如果说人生是一首优美的乐曲,那么痛苦则 是其中一个不可或缺的音符。 参考答案: 1 、如果说人生是一望无际的大海,那么挫折则 是其中一个骤然翻起的浪花。 2 、如果说人生是一片湛蓝的天空,那么失意则.
Advertisements

《微型计算机技术 及应用》 ( 第 4 版) —— 戴梅萼 史嘉权. 目标 深刻理解 牢固掌握 灵活应用.
痞 满 河南中医学院第一临床医学院 中医内科 郭淑云. 痞满是指以自觉心下痞塞,胸膈张满,触 之无形,按之柔软,压之无痛为主要症状的 病证。按部位痞满可分为胸痞、心下痞等。 【概念】
消化系统与健康饮食 井路路. 消化系统的结构和功能 第一篇 消化吸收 空肠、回肠 上消化道 下消化道 消化道.
高级服务器设计和实现 1 —— 基础与进阶 余锋
企业文化与核心价值观 主讲:孟凡驰 教授 中交四航局. 2 目 录 一、企业文化的目的价值恒久性与工具价值实践性 二、企业文化管理学特征 三、企业文化与企业发展战略 四、企业文化整合、提炼、培育和建设的目的 五、集团文化与分公司文化 六、企业核心价值观.
计算机组成原理 第三讲 计算机科学与技术学院 舒燕君.
计算机系统结构 西南林业大学计信学院 邢丽伟.
第一章 微型计算机系统概述 1.1 计算机的发展与应用 微型计算机的发展与分类 微型计算机的应用
温故知新 问题一:我国科技发展经过怎样的历程? 中华民族在历史上曾创造了辉煌灿烂的文化,世界领先;
计算机系统结构 (第9讲).
计算机网络课程总结 一、计算机网络基础 计算机网络定义和功能、基本组成 OSI/RM参考模型(各层的功能,相关概念, 模型中数据传输 等)
第7章 存储系统.
附中科學班 招生說明會 多元附中 第一選擇.
北京中医药大学东直门医院 把握“癌”的命脉 祁烁 血液肿瘤科.
讓人看了難忘的故事 中藥房轉載 分享人生積極正面訊息 創造宇宙合諧快樂能量.
門神 在傳統觀念中,門是居住環境中與外界相通的出入口,具有重要的屏障作用。門神顧名思義就是護宅守門的神仙,每逢過年,上至天子百官下至普通百姓,家家戶戶必在門上張貼門神,以保一家平安。 門神種類主要有宅第大門上將軍武門神、內室門戶上祈福文門神,還有童子門神、仙子門神等,形象豐富多樣,皇家貴戚還往往在畫上瀝粉貼金,十分吉祥喜慶。
公关协调 能力目标 初步学会对内及对外公众关系协调的基本方法。 知识目标 掌握组织内外公众协调的原理和方法。
计算机组成原理 北京理工大学计算机科学工程系 赵清杰 北京理工大学计算机科学工程系.
缓存(续).
辦理實習工場安全衛生業務經驗分享 新竹高工實習輔導主任  黃俊燁.
串台词和广告词.
第二节 工业地域的形成 工业联系 工业集聚 工业地域
當代國際企業.
实用操作系统概念 张惠娟 副教授 1.
第五章 存储层次 5.1 存储层次结构 5.2 Cache基本知识 5.3 降低Cache失效率的方法 5.4 减少Cache失效开销
计算机导论 第4讲 微型计算机硬件系统 1.
工程地质学 教师简介: 杨志双 副教授 1990年毕业于长春地质学院 获硕士学位 年到日本京都大学访问学习
第五章 存储层次 5.1 存储器的层次结构 5.2 高速缓冲存储器基本知识 5.3 降低Cache不命中率的方法
2.6 ARM存储器结构 ARM架构的处理器的存储器寻址空间有232=4G字节,该存储空间可以分为可快存/可缓冲(Cacheable /Bufferable)区域和不可快存/不可缓冲区域。 ARM架构的处理器,有的带有指令快存(I-Cache)和数据快存(D-Cache);但是,片内都不带有片内RAM和片内ROM。系统所需的RAM和ROM(包括闪存FLASH)都通过总线处接;故有的片内还带有存储器管理单元MMU(Memory.
面对经济全球化.
突出人才培养特色,构建面向就业的人才培养机制
关于知识产权与品牌战略思考 中国科学技术法学会会长 段 瑞 春 2008年11月14日.
§3 高速缓冲存储器(Cache) 工作原理和基本结构 地址映象与变换 Cache存储器的LRU替换算法的硬件实现
周学海 , 中国科学技术大学 2018/9/16 计算机体系结构 周学海 , 中国科学技术大学 中国科学技术大学.
第六章 市场调查和预测.
周学海 , 中国科学技术大学 2018/11/11 计算机体系结构 周学海 , 中国科学技术大学 中国科学技术大学.
周学海 中国科学技术大学 2018/11/20 计算机体系结构 周学海 中国科学技术大学.
存储系统.
管理信息结构SMI.
数 控 技 术 华中科技大学机械科学与工程学院.
第十章 IDL访问数据库 10.1 数据库与数据库访问 1、数据库 数据库中数据的组织由低到高分为四级:字段、记录、表、数据库四种。
What have we learned?.
逆向工程-汇编语言
数据挖掘工具性能比较.
CPU结构和功能.
何勉 新浪微博: Scrum框架及其背后的原则 原始图片 何勉 新浪微博:
内容摘要 ■ 课程概述 ■ 教学安排 ■ 什么是操作系统? ■ 为什么学习操作系统? ■ 如何学习操作系统? ■ 操作系统实例
C语言程序设计 主讲教师:陆幼利.
Cassandra应用及高性能客户端 董亚军 来自Newegg-NESC.
(Random Access Memory)
微机原理与接口技术 课程性质:专业技术必修课程 课程的特点:偏重硬件,软硬件结合 先修课程:导论、数字逻辑、组成原理、汇编语言等
台中監獄能源管制機制 大網 本監能源管制現有機制 本監各項能源管制硬體設施簡介 本監鍋爐用油紀錄及契約用電分析 節約能源未來擬施作措施 結束.
第八章 总线技术 8.1 概述 8.2 局部总线 8.3 系统总线 8.4 通信总线.
知识产权在中小企业中的作用 讲座内容 一、知识产权在发达国家及知名企业中的地位 二、知识产权的基本概念及其特点
铂安智防务科技有限公司 辅助驾驶设备 2017.
临界区问题的硬件指令解决方案 (Synchronization Hardware)
静定结构位移计算 ——应用 主讲教师:戴萍.
信用部財務專業人員初級研習班 台灣債券市場簡介
_03宽字符与Unicode编程 本节课讲师——void* 视频提供:昆山爱达人信息技术有限公司 官网地址:
基于列存储的RDF数据管理 朱敏
C++语言程序设计 C++语言程序设计 第一章 C++语言概述 第十一组 C++语言程序设计.
24 or 1024? PWN Jawbone Up24 手环.
插入排序的正确性证明 以及各种改进方法.
FVX1100介绍 法视特(上海)图像科技有限公司 施 俊.
项目6 培育忠诚客户 1.
題目:合作學習融入數學學習領域 課程與教學之行動研究
县级支中心 乡镇基层服务点的建设 朱 庆 华.
96 教育部專案補助計畫案明細 單位 系所 教育部補助款 學校配合款 工作໨目 計畫主 持人 備註 設備費 業務費 579,000
Presentation transcript:

5.5 减少命中时间 5.5.1 容量小、结构简单的Cache 第五章 存储层次 1. 硬件越简单,速度就越快; 2. 应使Cache足够小,以便可以与CPU一起放 在同一块芯片上。

5.5.2 虚拟Cache 1. 虚拟Cache 访问Cache的索引以及Cache中的标识都 是虚拟地址(一部分)。 5.5 减少命中时间 5.5.2 虚拟Cache 1. 虚拟Cache 访问Cache的索引以及Cache中的标识都 是虚拟地址(一部分)。 2. 并非都采用虚拟Cache(为什么?) 3. 虚拟Cache的清空问题 解决方法:在地址标识中增加PID字段 (进程标识符) 三种情况下失效率的比较 单进程,PIDs,清空 PIDs与单进程相比:+0.3%~+0.6% PIDs与清空相比: -0.6%~-4.3%

优点:兼得虚拟Cache和物理Cache的好处 局限性:Cache容量受到限制 (页内位移) 5.5 减少命中时间 4. 同义和别名 解决方法:反别名法,页着色 5. 虚拟索引+物理标识 优点:兼得虚拟Cache和物理Cache的好处 局限性:Cache容量受到限制 (页内位移) Cache容量≤页大小×相联度 6. 举例:IBM3033的Cache 页大小=4KB 相联度=16

5.5.3 写操作流水化 5.5.4 Cache优化技术总结 31 12 11 Cache容量=16×4KB=64KB 5.5 减少命中时间 31 12 11 页地址 地址标识 页内位移 索 引 块内位移 Cache容量=16×4KB=64KB 7. 另一种方法:硬件散列变换 5.5.3 写操作流水化 (图 5.22) 5.5.4 Cache优化技术总结 (表 5-9)

优化技术 失效率 失效开销 命中时间 硬件复杂度 评价 + - + - 1 + 2 + 2 + 2 + 3 + 增加块大小 + -   实现容易;RS/6000 550采用了128字节 MIPS R10000为4路组相联 提高相联度 +   - 1 HP7200中采用了类似的技术 Victim Cache +     2 已应用于MIPS R10000的第二级Cache 伪相联Cache +     2 数据预取比较困难;仅被几台机器采用,如:Alpha 21064 硬件预取指令 和数据 +     2 需采用非阻塞cache;有几种机器支持它 +     3 编译器控制的预取 用编译技术减少Cache失效次数 向软件提出了新要求;有些机器提供了编译器选项   +  

使读失效优先级高于写   +   1 在单处理机上实现容易,被广泛使用 子块调入   +   1 主要用于减少标识的数目 尽早重启动和关键字优先   +   2 已应用于MIPS R10000和IBM 620 非阻塞Cache   +   3 已应用于Alpha 21064和R10000中     硬件代价大;两级Cache的块大小不同时实现困难;被广泛采用 + 2 第二级Cache 容量小且结构简单的Cache   - + 实现容易,被广泛使用 避免在对Cache进行索引时进行地址转换 对于小容量Cache来说实现容易,已应用于Alpha 21064     + 2     流水化写 + 1 已应用于Alpha 21064