清华大学计算机科学与技术系高性能计算研究所 郑纬民 教授 2007年10月

Slides:



Advertisements
Similar presentations
第七章 半导体存储器 《数字电子技术》7.1 概述 7.2 只读存储器( ROM ) 7.5 用存储器实现组合逻辑函数 7.4 存储器的扩展 7.3 随机存储器( RAM ) 7.6 集成芯片简介及应用举例.
Advertisements

1 1.2 信息的表示与存储  数据:数据是对客观事物的符号表示。 如,数值、文字、语言、图形、图像等都是不同形 式的数据。  信息:信息是既是对客观事物变化和特征的反映,又 是事物之间相互作用、相互联系的表征。 信息必须数字化编码,才能用计算机进行传送、存 储和处理。 信息具有针对性和时效性。
五年制精神医学本科生培养方案 刘哲宁 教授. 专业简介  精神医学是临床医学的一个重要分支,它是研究人 类精神活动的规律、防治精神疾病的一门重要学科。  掌握健康与疾病的概念。
《公路纵断面设计》 —— 纵断面设计的要求 道桥系 二○○七年五月. 纵断面设计的一般要求 1 .纵坡设计必须满足《公路工程技术标准》中的各项规定。 2 .为保证汽车能以一定的车速安全舒顺地行驶,纵坡应具有 — 定 的平顺性,起伏不宜过大及过于频繁。尽量避免采用极限纵坡 值.缓和坡段应自然地配合地形设置,在连续采用极限长度的.
第6章 存储系统 6. 1 存储器的分类与性能评价 6. 2 存储器访问的局部性原理与 层次结构存储系统 6. 3 半导体存储器
内框架和底层框架砖房的抗震鉴定与加固 中国建筑科学研究院 尹保江
第十五章 控制方法.
从永磁体谈起.
学习单元——仿宋字. 学习单元——仿宋字 字体的由来 印刷字体的一种,仿照宋版书上所刻的字体,笔画粗细均匀,有长、方、扁三体。也叫仿宋体,仿宋字。 后来人们又模仿宋体字的结构、笔意,改成笔画粗细一致、秀丽狭长的印刷字体,这就是仿宋体。
专题19 自然灾害与防治.
给排水设备安装检测培训 2010年12月01日.
学习情境三 桥梁下部结构的构造与施工 桥梁墩台的构造.
第二章 流水施工原理及应用 2.1 流水施工概述 2.2 流水施工参数 2.3 与流水施工方式有关的术语 2.4 流水施工方式
第7章 存储系统.
新材料作文.
第四章 存储系统 4-1 存储系统概论 4-2 RAM(随机读写存储器) 4-3 ROM(只读存储器) 4-4 高速缓冲存储器(Cache)
門神 在傳統觀念中,門是居住環境中與外界相通的出入口,具有重要的屏障作用。門神顧名思義就是護宅守門的神仙,每逢過年,上至天子百官下至普通百姓,家家戶戶必在門上張貼門神,以保一家平安。 門神種類主要有宅第大門上將軍武門神、內室門戶上祈福文門神,還有童子門神、仙子門神等,形象豐富多樣,皇家貴戚還往往在畫上瀝粉貼金,十分吉祥喜慶。
电磁铁.
建筑施工组织 福州海峡职业技术学院 王 韶 先.
塔设备.
一寸光阴一寸金 寸金难买寸光阴 时间.
中小学校舍建设管理 《地县教育局基建专干培训班》 克拉玛依 2015年11月 校舍建设管理与现存问题对策 1.
电工作业培训 电气安全用具与安全标识                                                                          主讲:梁宏志.
創 見 科 技 497e0033 張盈盈 497e0105 林幸兒 指導老師:黃淑玲.
第三章 存储系统 现代计算机系统都以存储器为中心 在计算机运行过程中,存储器是各 种信息存储和交换的中心。
畜禽屠宰厂(场)的设置.
人力资源市场统计工作介绍 人力资源市场与人员调配处 郭俊霞 2014年12月.
第三节 渐开线圆柱齿轮精度等级及应用.
第6章 半导体存储器 6.1 概述 6.2 随机读写存储器(RAM) 6.3 只读存储器(ROM) 6.4 存储器的扩展
營造業工地主任 220小時職能訓練課程 第四單元 測量放樣 講師 鄭子正 2017/3/17.
第11章 计算机系统 计算机系统概述 分类方法、计算机系统性能评测方法 2. 微机系统 3. 他体系结构处理机
特种设备安全管理 张剑 1.
操作系统 Operating System.
产品设计/// 调研报告 06产品造型设计(1) 席 宇 张永益 吴小艺
动画分镜头技巧 梁思平.
第4章 主存储器 4.1 主存储器概述 4.2 读/写存储器 4.3 非易失性存储器 4.4 DRAM的研制与发展
复习回顾 2.2 计算机硬件系统 2.1 计算机发展概述 1、芯片组的作用是什么? 1、计算机分为几代?主要元器件是什么?
● 计算机组成与维护 外存储器 第5章 本章要点 硬盘、光驱、移动硬盘的组成 硬盘、光驱的性能指标 外存储器的使用.
科技出版物应正确执行GB/T —2011 陈 浩 元 《北京师范大学学报(自然科学版)》编辑部, ,
第四章 存储体系.
半导体存储器 第四章 半导体存储器.
第五章 防雷与安全用电管理 第一节 雷 电 简 介   一、雷电的形成   雷电是由雷云(带电的云层)对地面建筑物及大地的自然放电引起的,它会对建筑物或 设备产生严重破坏。因此,对雷电的形成过程及其放电条件应有所了解,从而采取适当的措施,保护建筑物不受雷击。   在天气闷热潮湿的时候,地面上的水受热变为蒸汽,并且随地面的受热空气而上升,在.
学校食物中毒的预防与控制 邓 红 四川旅游学院
电力工程检测试验费用计算方法 2015年10月.
湖南农业大学农业航空团队研究成果 航空作业机型 湖南农业大学农业航空研究中心 成果专栏 ◎团队简介
我国的人民民主专政.
電話有效過濾辨識系統 一.為何需要有效電話? 在電話行銷業,大量的電話call Out,是必須要做的工作,但因電話是否有效(意指是否撥得通),無法確知,使得有限的人力,浪費了很多時間,不僅降低了人員的生產力也打擊了行銷人員的士氣,尤其是新進人員的留任意願,更是雪上加霜!
第7章 表單的使用介面 7-1 表單的基礎 7-2 使用精靈建立表單 7-3 表單視窗的檢視模式 7-4 表單的基本使用
存储器的层次结构 512KB~8MB 400GB/S 1~8GB 12GB/S CPU Cache RAM 500GB DISK
淘宝核心系统数据库组 余锋 利用新硬件提升数据库性能 淘宝核心系统数据库组 余锋
第五章 存储系统 半导体存储器概述 系统内存扩充 高速缓冲存储器 虚拟存储器 PC系列机中的主存储器 习题与思考 上一章 目 录 帮助
第5章 存储系统.
第2章 電腦硬體知識 2-1 電腦基本硬體結構 2-2 電腦的週邊設備 2-3 電腦的操作與保養
生物技术实验—凝集反应 免疫学教研室 刘平.
计算机系统结构 第一章 基本概念 第二章 指令系统 第三章 存储系统 第四章 输入输出系统** 第五章 标量处理机 第六章 向量处理机
黄土高原的水土流失 标题 水土流失的原因 水土流失的危害 治理措施 参考文献 小组成员.
第四章 存储器管理 4.1 存储器的层次结构 4.2 程序的装入和链接 4.3 连续分配方式 4.4 基本分页存储管理方式
计算机系统结构(2012年春) ----存储层次: Cache基本概念
微机原理与接口技术 ——第三章 80x86微处理器 西安邮电大学 计算机学院 范琳.
熟能生巧、每日一练: 五分钟打字练习.
组合逻辑电路 ——中规模组合逻辑集成电路.
例題:某人由地面同時向空中拋出 A、B 兩球,A 球之初速為 vA,仰角為 θA,B 球則為 vB 及 θB,且 θA > θB。設兩球在同一水平面內運動,而且所達到的最大高度也相同,則下列敘述何者為正確? (A) vA > vB (B) A 球之水平射程較 B 遠 (C) 兩球同時到達最高點.
猜數字遊戲.
实验八 石蜡切片法.
第六章 記憶體.
知识点4---向量的线性相关性 1. 线性相关与线性无关 线性相关性的性质 2..
第三章 半导体存储器及其接口 第一节 概述 第二节 半导体存储器 第三节 半导体存储器与CPU接口 一、存储器的分类
动量守恒定律的应用 石油中学 高星.
长度和时间的测量.
第三章 计算机体系结构.
Presentation transcript:

清华大学计算机科学与技术系高性能计算研究所 郑纬民 教授 2007年10月 计算机科学与技术系研究生课程 高等计算机系统结构 清华大学计算机科学与技术系高性能计算研究所 郑纬民 教授 2007年10月

高等计算机系统结构 第一章 高等计算机的核心技术——并行处理 第二章 加速比性能模型与可扩展性分析 第三章 互连与通信 第四章 划分与调度 第一章 高等计算机的核心技术——并行处理 第二章 加速比性能模型与可扩展性分析 第三章 互连与通信 第四章 划分与调度 第五章 并行存储器系统 第六章 Cache Coherence 第七章 Memory Consistency 第八章 指令级并行处理

第五章 并行存储器系统 5.1 存储器系统的层次结构 5.2 包含性、一致性和局部性 5.3 存储器容量的规划 5.4 虚拟存储器技术 5.5 交叉访问的存储器

5.1 存储器系统的层次结构 存储器系统的层次结构如下图所示: 容量和存取时间增加 每位成本增加 层0:M0 CPU内的寄存器 高速缓存 主存储器 层2:M2 磁盘存储器 层3:M3 磁带机 层4:M4

存取时间ti:从CPU到第i层存储器的往返时间 五个参数: 存取时间ti:从CPU到第i层存储器的往返时间 存储器容量Si:第i层的字节或字的数量 每字节成本Ci:第i层存储器的成本为CiSi 传输带宽bi:相邻层之间传送信息的速率 传输单位Xi:i和i+1层之间数据传送的粒度 对存储器系统中各层次存储器的特性,1993年的统计数据如下表:

存储器层次 第0层 第1层 第2层 第3层 第4层 特性 CPU寄存器 高速缓存 主存储器 磁盘存储器 磁带存储器 设备工艺 ECL SRAM DRAM 磁盘机 磁带机 存取时间 10ns 25-40ns 60-100ns 10-20ms 2-20min 容量(字节) 512B 128KB 512MB 60-228GB 512G-2TB 成本(美分/KB) 18000 72 5.6 0.23 0.01 带宽(MB/S) 400-800 250-400 80-133 3-5 0.18-0.23 传送单位 字:4-8B 块:32B 页:0.5-1KB 文件:5-512KB 后援存储器 分配管理 编译器分配 硬件控制 操作系统 操作系统/用户 操作系统/用户

第五章 并行存储器系统 5.1 存储器系统的层次结构 5.2 包含性、一致性和局部性 5.2.1 包含性 5.3 存储器容量的规划 第五章 并行存储器系统 5.1 存储器系统的层次结构 5.2 包含性、一致性和局部性 5.2.1 包含性 5.2.2 一致性 5.2.3 局部性 5.3 存储器容量的规划 5.4 虚拟存储器技术 5.5 交叉访问的存储器

5.2 包含性、一致性和局部性 5.2.1 包含性(inclusion) 1. 包含性的定义 M0 M1 M2……  Mn 所有信息项最初存放在最外层Mn,在处理过程中,它的子集复制到Mn-1,同样, Mn-1的子集复制到Mn-2,…… 如果在Mi中找到一个信息字,那么同一个字的复制品在所有的高层Mi+1,Mi+2,……,Mn中都一定可以找到。

2. 相邻层之间的数据传送单位 CPU高速缓存:字 高速缓存主存储器:块(每块32个字节(8个字)) 主存磁盘:页面(比如每页4K字节,包含128块) 磁盘磁带:段 包含性可以用下面的图来说明:

CPU寄存器 字单位 …… b M1:高速缓存 a,b为高速缓存 块,32个字节 a …… 块单位 页面A a 页面B b M2:主存储器 页单位 段F 页面A a 页面B b 段G M3:磁盘 存储器 段单位 段F 页面A a 页面B b M4:磁带机 后援存储器 段G

同一个信息项与后继存储器层次的副本是一致的。 5.2.2 一致性(coherence) 1.一致性定义 同一个信息项与后继存储器层次的副本是一致的。 如果在高速缓存中的一个字被修改过,那么在所有更高层上该字的副本也必须立即或最后加以修改 。

2.维护一致性的两种策略 (1)写直达(write-through,WT),即如果在Mi(i=1,2,…,n-1)中修改了一个字,则在Mi+1中需要立即修改。 (2)写回(write-back,WB),即如果在Mi+1 中的修改延迟到Mi中正在修改的字被替换时才进行。

5.2.3 局部性(locality) Hennessy和Patterson(1990年)提出了一条90-10规则:典型程序在10%的代码上可能要耗费其执行时间的90%(例如嵌套循环操作的最内层循环)。 时间局部性(temporal locality):最近的访问项(指令或数据)很可能在不久的将来再次被访问。即对最近使用区域的集中访问。

空间局部性(spatial locality):一个进程访问的各项的地址彼此很近,例如,表操作或数组操作含对地址空间中某一区域的集中访问。 顺序局部性(sequential locality):在典型程序中,除非转移指令产生不按次序的转移外,指令都是顺序执行的。 局部性原理指导我们去设计高速缓存、主存储器以及虚拟存储器组织。

第五章 并行存储器系统 5.1 存储器系统的层次结构 5.2 包含性、一致性和局部性 5.3 存储器容量的规划 5.3.1 命中率 第五章 并行存储器系统 5.1 存储器系统的层次结构 5.2 包含性、一致性和局部性 5.3 存储器容量的规划 5.3.1 命中率 5.3.2 有效存取时间 5.4 虚拟存储器技术 5.5 交叉访问的存储器

5.3 存储器容量的规划 存储器层次结构的性能是由层次结构的有效存取时间Teff决定的,它依赖于相继层次的命中率和访问频率。

在Mi中找到一个信息项时,称之为命中,反之称为缺失。 5.3.1 命中率 在Mi中找到一个信息项时,称之为命中,反之称为缺失。 假定在层次结构中的存储器层次为Mi和Mi-1,其中i=1,2,…,n。在Mi层的命中率hi则是信息项可在Mi中找到的概率。它是表示两个相邻层Mi-1和Mi特性的函数。在Mi中的缺失率定义为1-hi。

是指在较低层次有i-1次缺失而在Mi有一次命中时访问Mi成功的概率。 相继层的命中率是存储器容量、管理策略和程序行为的函数,它是独立的随机变量,其值在0到1之间。我们假设h0=0和hn=1,这意味着CPU总是先访问M1,并且访问到最外层Mn时总是命中的。 对Mi的访问频率为: 是指在较低层次有i-1次缺失而在Mi有一次命中时访问Mi成功的概率。

通常情况下,有: 这说明,访问内存比访问外存要多。

5.3.2 有效存取时间 每当发生缺失时,就要付出代价去访问较高层次的存储器。这种缺失在Cache中称为块缺失。在主存储器中称为缺页错(page fault),因为块和页面是这些层次之间传送信息的单位。 缺页错付出的时间代价要比块缺失付出的更大:

5.3.3 层次结构的优化 目标: 使Teff接近于M1的t1, 总成本接近于Mn的Cn。 优化过程可以表达为:对一个线性规划求最小值问题:

要达到有效存取时间Teff=10.04s,高速缓存命中率为h1=0.98,主存储器命中率h2=0.9,总成本上限为15000美元。 例子:存储器层次结构设计 存储器层次 存取时间 容量 价格/K字节 高速缓存 主存储器 磁盘阵列 t1 = 25ns t2 = 未知 t3 = 4ms s1=512K字节 s2=32M字节 s3 = 未知 c1=1.25美元 c2=0.2美元 c3=0.0002美元 要达到有效存取时间Teff=10.04s,高速缓存命中率为h1=0.98,主存储器命中率h2=0.9,总成本上限为15000美元。

解: 如果在同样的预算限制条件下,要吧主存储器容量提高64M字节,那么只好以减少磁盘容量为代价,但是这一变化并不影响高速缓存的命中率。如果使用合适的页面替换算法,可能会增加主存储器的命中率,Teff有所降低。

层次化存储器系统必须解决的问题: (1)数据块在较高层存储器中存放在哪个位置?即块和页的定位问题。如果一个块存放在某一上层存储器中,怎样确定并找到该块,即块的寻址问题。 (2)不命中的将从下层存储器中访问,并将该块调入上层存储器中,但是如果上层存储器中已无空闲空间,则势必将上层存储器中的某一块调出,但应调出那一块,即替换问题。 (3)在写访问时,写入上层存储器中的数据必须在适当的时候写入下层存储器,何时写?

第五章 并行存储器系统 5.1 存储器系统的层次结构 5.2 包含性、一致性和局部性 5.3 存储器容量的规划 5.4 虚拟存储器技术 第五章 并行存储器系统 5.1 存储器系统的层次结构 5.2 包含性、一致性和局部性 5.3 存储器容量的规划 5.4 虚拟存储器技术 5.3.1 共享存储和分布存储 5.3.2 DSM与SVM 5.3.3 虚拟存储器的主要技术 5.5 交叉访问的存储器

5.4 虚拟存储器技术 提要: 虚拟存储器提供了几乎没有限制的存储器工作空间。 虚拟地址在编译时产生。 虚拟地址到物理地址的转换在运行时进行,需要使用转换表和映象系统。 替换策略。

5.4.1 共享存储和分布存储 MIMD系统可以分为两种: (1)tightly coupled shared-Memory multiprocessors (2)loosely coupled distributed-Memory multiprocessors 它们可以用图表示如下:

ICN ICN P1 P2 …… Pn share-Memory multiprocessors SM1 …… SMm P LM P LM distribued-Memory multiprocessors ICN

共享存储和分布存储的优缺点: 共享存储器: 易于编程,是单机的自然延伸; 程序员无数据划分的负担; 多进程并发的开销小,效率高,易于进程迁移,任务动态分配简单; 由于每个处理器都通过总线访问存储器,因而限制了处理器的个数,可扩展性差。

分布存储器: 系统结构灵活,可扩展性好; 处理机数目可达成百上千,处理速度有巨大的发展潜力; 算法设计、编程以及任务动态分配比较困难; 很难在处理机之间传递复杂的数据结构,难于进程迁移; 不能支持需要存储空间的大规模数据处理要求。

分布存储的两种编程方法: (1)message-passing,用send,receive原语实现通信,要求程序员在进程的整个运行期间对数据的移动都很清楚; (2)romote procedure call,语言一级传送控制与数据,可以看作是本地调用,但透明度有限。

缺点: 这两种方法都是用来解决不同地址空间的问题,在接点间传递复杂数据结构时都比较困难,需要打包,传递指针也不可能实现。由于个处理机拥有不同的地址空间,使得进程迁移时,该进程所分配到的操作系统资源也得一起移动(打开得文件、文件存取控制块等),这很费时。

5.4.2 DSM与SVM 1.DSM和SVM的提出 如何把共享和分布的优点结合起来,取长补短? 共享分布存储器(Distributed shared Memory,DSM) 虚拟共享存储器(Shared Virtual Memory,SVM) ——基于分布存储器的多处理机上,实现物理上分布但逻辑上共享的存储器系统。

虚拟共享存储器的逻辑结构: 虚拟共享存储器 CPU1 CPU2 CPUn …… LM1 LM2 LMn 地址映射 部件 地址映射 部件

MIMD机器存储系统的发展方向: 共享存储器 分布存储器 共享分布存储器

2.DSM系统的特点 在DSM系统中,每一台处理机都可以访问全局存储器的任一位置,用户可以把它当成全局共享存储器系统。 优点: 编程容易 系统结构灵活 可扩展性好 系统价格低 有较好的软件移植性

DSM系统编制的程序比用消息传递方式编制的程序效率高:

(2)许多并行应用程序都是分阶段执行的,每次执行前,都有一个数据交换阶段,其时间受通讯限制。在DSM系统中,数据只有用到的时候才传送,取消了数据交换阶段,把通讯时间加以分散,提高了并行性。

3.实现DSM的途径 主要有三种: (1)硬件实现:将传统的cache技术扩展应用到松耦合分布式存储多处理机。要增加专用部件以取得高效的实现。 (2)操作系统和库实现:利用虚拟存储管理机制取得共享(sharing)和一致(coherence)。 (3)编译实现:自动将共享访问转换成同步和一致原语。用户需要显式控制全局数据,当传递大量数据时或试图进行进程迁移时极其复杂。

4.主要技术 结构(structure) 粒度(granularity) 数据访问与一致性(access and cosistency) 一致性语义(coherence semantics) 可扩展性(scalability) 异构性(heterogeneity) 结构——指共享数据在存储器中的框架(如对象和语言的类型); 粒度——指基本共享单位长度(如字节、字、页或复杂数据结构)。

第五章 并行存储器系统 5.1 存储器系统的层次结构 5.2 包含性、一致性和局部性 5.3 存储器容量的规划 5.4 虚拟存储器技术 第五章 并行存储器系统 5.1 存储器系统的层次结构 5.2 包含性、一致性和局部性 5.3 存储器容量的规划 5.4 虚拟存储器技术 5.5 交叉访问的存储器 5.5.1 两种组织方式 5.5.2 两种方式的比较 5.3.3 带宽和容错

5.5 交叉访问的存储器 主存储器由多个模块构成。 假设主存储器包含m=2a个存储器模块,每个模块包含w=2b个存储单元(字),则总存储容量为

5.5.1 两种组织方式 交叉访问的存储器可以分为两种: (1)低位交叉方式 (2)高位交叉方式

存储器地址的低a位用来指明存储器模块,高b位是每个模块内的字地址。 1.低位交叉方式 存储器地址的低a位用来指明存储器模块,高b位是每个模块内的字地址。 低位m路交叉存取如下图:

模块地址缓冲器 …… 地址译码器 MAB MAB MAB M0 M1 Mm-1 a 1 m-1 …… m m+1 2m-1 字 模块 …… …… …… 地址 m(w-1) mw-m+1 mw-1 b MDB MDB MDB M D B 存储器数据缓冲器 数据总线 字地址缓冲器

2.高位交叉方式 存储器地址的高a位作为存储器模块地址,邻接的存储器单元被分配在同一个存储器模块中,在每个存储器周期内,只能对各模块存取一个字。所以不支持邻接单元的成块存取。 高位m路交叉存取如下图:

模块地址缓冲器 …… 地址译码器 MAB MAB MAB M0 M1 Mm-1 w (m-1)w a …… 1 w+1 mw-w-1 模块 字 …… …… …… 地址 w-1 2w-1 mw-1 b MDB MDB MDB M D B 存储器数据缓冲器 数据总线 字地址缓冲器

5.5.2 两种方式的比较 (1)低位交叉以流水线方式支持成块存取 8路低位交叉存取如下图: 将存储器周期称为主周期,细分为m个小周期(m称为交叉存取度),如8路交叉,m=8,w=8,a=b=3,设为主周期,为小周期,则 8路低位交叉存取如下图:

数据 存储器地址寄存器(6位) M0 M1 M2 M3 M4 M5 M6 M7 1 2 3 4 5 6 7 8 9 10 11 12 13 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 … … … … … … … … 56 57 58 59 60 61 62 63 数据

为主周期,= /m为小周期,m为交叉存取度 低位交叉流水线方式示意图: W7 W6 W5 W4 W3 W2  W1 W0 时间  为主周期,= /m为小周期,m为交叉存取度

(2)如果应用问题很少共享地址空间,把一个进程的几页集中在高位交叉存储器的某个给定的存储器模块种,能有效的减少存储器干扰,即每个存储器模块只和一台处理机有关,可以减少存储器冲突。

5.5.3 带宽和容错 1.带宽 讨论低位交叉情况。 带宽B的上限为m,下限为1。Hellerman(1967年)推导出来的公式为: 如果使用16个存储器模块,则有效存储器带宽大约是单个存储器的4倍。产生这一悲观估算的原因是:不同长度的块存取与单字存取在用户程序中是随机混合的。

所以,交叉存取适合于长向量的流水线存取。 另外一种估算公式:Cragon(1992年) 假设n个分量存放在m路交叉存取存储器系统邻接的存储单元中,存取向量的一个分量所需的平均时间t1可估算为: 所以,交叉存取适合于长向量的流水线存取。

2.容错 将高位与低位交叉存取加以组合。 高位交叉时,各存储器模块内的地址是按顺序编排的。 对8个存储模块,将它们分为2个存储器,体内采用4路低位交叉存取。示意图如下:

体0 体1 存储器地址寄存器(6位) 模块地址 体地址 字地址 M0 M1 M2 M3 M4 M5 M6 M7 1 2 3 32 33 34 1 2 3 32 33 34 35 4 5 6 7 36 37 38 39 … … … … … … … … 28 29 30 31 60 61 62 63 体0 体1

对8个存储模块,将它们分为4个存储器,体内采用2路低位交叉存取。示意图如下:

体0 体1 体2 体3 存储器地址寄存器(6位) 模块地址 体地址 字地址 M0 M1 M2 M3 M4 M5 M6 M7 1 16 17 1 16 17 32 33 48 49 2 3 18 19 34 35 50 51 … … … … … … … … 14 15 30 31 46 47 62 63 体0 体1 体2 体3

在一个模块发生故障的情况下: 8路交叉存取存储器的最大存储器带宽减少到零; 4路2体交叉存储器的最大带宽减少到每周期4个字(只有一个体被废弃); 2路4体交叉存储器中,仍有3个体工作,所以最大带宽为6个字。

习题: 假定一个由16个存储器模块构成的主存储器系统有下列三种交叉存储器设计方案。每个模块的容量为1M字节,机器按字节寻址。 设计1:用1个存储体16路交叉。 设计2:用2个存储体8路交叉。 设计3:用4个存储体4路交叉。 (a)确定上述存储器组织的地址构成。 (b)在上述每种存储器组织中,假定只有一个存储器模块失效,确定能获得的最大存储器带宽。 (c)比较说明三种交叉存储器组织的优缺点。