计算机系统结构 —嵌入式系统 闵华松 主讲 2008年春季 武汉科技大学计算机学院
联系方法 主讲教师: 闵华松 博士 地 址: 新校区教三楼216 计算机学院5楼嵌入式系统实验室 电 话: 68893266 闵华松 博士 地 址: 新校区教三楼216 计算机学院5楼嵌入式系统实验室 电 话: 68893266 13971365898 邮件地址: mhuasong@wust.edu.cn
课程目的 该课程针对目前最流行的32位嵌入式处理器ARM体系结构、指令系统及其应用开发方法进行讲授。 通过本课程的学习,要求学生一般掌握嵌入式系统的基础知识,牢固掌握ARM体系结构及指令系统,重点掌握ARM9处理器系列中应用最广的ARM9TDMI处理器,内容包括存储器接口、协处理器接口和调试接口,以及指令周期时序和各种操作的时序;简单了解几种已进入国内市场的带ARM核的芯片;熟悉基于ARM核芯片的开发应用方法。
需要的基础知识 先导课程 需要了解的基础知识 数字逻辑; 汇编语言 计算机组成原理 了解逻辑门电路的基本设计方法、计算机组成原理的基本概念,能够理解汇编语言。
学时分配 课程属性: 专业必修课(嵌入式系统模块) 总学时数: 64 课内学时: 64 讲课学时数:50 实验学时数:14
课程内容与学时分配表 内容 学时 1.第1章 处理器设计导论 4 2.第2章 ARM体系结构 2 3.第3章 ARM汇编语言编程 6 5.第5章 体系结构对高级语言的支持 6.第6章 Thumb指令集 7.第7章 体系结构对系统开发的支持 8.第8章 ARM处理器核 9.第9章 存储器层次 10.第10章 体系结构对操作系统的支持 总学时 50
理论教材 实验教材 参考教材 教 材:[英] Steve Furber,ARM SoC体系结构,北京航空航天大学出版社,2002 北京博创 up-netarm2410-s嵌入式系统实验指导书 参考教材 [1] Arnold S. Berger 计算机硬件及组成原理,机械工业出版社 [2]马忠梅,ARM嵌入式处理器结构与应用基础,北京航空航天大学出版社,2001 [3] 陈章龙,嵌入式系统——Intel StrongARM 结构与开发,北京航空航天大学出版社,2002 [4] 马忠梅,AT91系列ARM核微控制器结构与开发.北京航空航天大学出版社,2003
考核方式和评分标准 考核方式 平时作业和表现(占10%)+实验(占20%)+笔试(70%,闭卷考试 )
C H A P T E R 1 处理器设计导论
主要内容 1 处理器体系结构和组织 2 硬件设计中的抽象 3 MU0 一个简单的处理器 4 指令集的设计 5 处理器设计中的权衡 6 精简指令集计算机 7 低功耗设计
1.1 处理器体系结构和组织 PC架构? 嵌入式系统架构?
计算机系统的三大领域 服务器市场 功能强 利润最大的市场 可用性强 可扩展性 桌面市场 最广阔的市场 嵌入式市场 潜力最大的市场
亚微计算机(嵌入式计算机) 是以嵌入式系统的形式隐藏在各种装置、产品和系统中 以往计算机分类: 大型计算机、中型机、小型机和微计算机 目前计算机分类: 超级计算机,大型计算机、工作站、微计算机、亚微计算机 亚微计算机(嵌入式计算机) 是以嵌入式系统的形式隐藏在各种装置、产品和系统中
计算机发展的三大阶段 第一阶段:始于五十年代的由IBM, Burroughs, Honeywell等公司率先研制的大型机。 第二阶段:始于七十年代的个人计算机。 第三阶段:计算机正迈入下一个充满机遇的阶段—“后PC时代”或“无处不在的计算机”阶段。
计算的发展过程 普适计算 资源使用的灵活性 协同计算 基于网络的 个人计算 普适计算终端 分布式计算 基于开放系统的客户/服务器 分时系统 微型机 分布式计算 小型机 分时系统 批处理系统 单用户系统 大型机 计算的自由性
无处不在的计算机 施乐公司Palo Alto研究中心主任Mark Weiser认为: “从长远来看,PC机和计算机工作站将衰落,因为计算机变得无处不在:例如在墙里、在手腕上、在手写电脑中(象手写纸一样)等等,随用随取、伸手可及”。
无处不在的计算机 全世界的计算机科学家正在形成一种共识: 计算机不会成为科幻电影中的那种贪婪的怪物, 而是将变得小巧玲珑, 无处不在. 他们藏身在任何地方, 又消失在所有地方, 功能强大, 确有无影无踪. 人们将这种思想命名为: “无所不在的计算机”。
嵌入式系统无处不在 彼此互连
即使远在火星 火星与地球,这一对在星空中遥遥相望的“兄弟”,迎来6万年来“最亲密的接触”,在2003年8月27日这一天,火星距离地球最近达到55756622(5千多万)公里。 面对6万年才有一次的机会,科学家们积极行动起来———从6月开始,先后有欧洲的“火星快车”、美国“勇气号”和“机遇号”等三颗火星探测器飞往火星,而日本一颗本已在太空“迷失方向”的火星探测器也在关键时刻及时“醒”来,开始了久违的火星之旅。 勇气号
基于VXworks的火星探路者
土星探测 自1997年10月15日发射以来,经历了7年35亿公里航程的卡西尼号太空船在2004年7月1日10时30分进入土星轨道,开始进行人类有史以来对土星及其31颗已知卫星最详尽的探测。
“哥伦比亚”号,整个系统的起飞重量达2000吨,高56米。
“小鹰”号标准排水量为60100吨,满载排水量达81123吨,舰长323. 6米,舰宽39. 6米,吃水11 “小鹰”号标准排水量为60100吨,满载排水量达81123吨,舰长323.6米,舰宽39.6米,吃水11.4米,是世界上最大的常规动力航空母舰。舰员2930名,其中军官155名;航空人员2480名,其中军官320名。飞机:F-14D战斗机20架,F/A-18战斗机36架,E-2C预警机和EA-6B电子干扰机各4架,6架S-3B反潜机,6架直升机,2架ES-3A。
Smart Dust http://robotics.eecs.berkeley.edu/~pister/SmartDust/
智能玩具与机器人
嵌入式技术应用——工业控制 工业方面:机床、冶金、电子、交通、航空航天等行业技术升级的重要基础
军事侦察 阿富汗参加反恐作战的“赫耳墨斯”价值4万美元,可携带2架摄像机,发挥了很好作用。
反恐防暴 2002年11月28日,以色列一选举投票点,发生枪击事件,造成至少7人死亡,数十人受伤。以警方用机器人在检查一具巴勒斯坦枪手的尸体。
空中飞行器 微型飞行器---“黑寡妇”
Wearable Computing
基于Win CE的移动机器人平台
基于RTLinux的仿人机器人 高 48 cm 重: 6 kg 灵活性:20 DOF 操作系统: RT-Linux 接口形式: USB 1.0 (12Mbps) 响应周期: 1ms 能源: DC24V x 6.2A (150W) 制造:富士通
新华网西昌10月24日电:18时05分长征三号甲运载火箭发射,经过1473秒飞行后,将嫦娥一号卫星送入太空,完成自己的使命。 18时29分,南太平洋上的远望三号测量船报告,星箭成功分离。紧接着,经过测算,北京航天飞行控制中心传来数据,卫星进入近地点为205公里,远地点为50930公里,周期为16小时的超地球同步轨道。卫星发射取得圆满成功!
“嫦娥一号”探测卫星
无处不在的计算机是计算机与使用者的比率达到和超过100:1的阶段 无处不在的计算机包括通用计算机和嵌入式计算机系统 在100:1比例中95%以上都是嵌入式计算机系统,并非通用计算机 嵌入式设备无处不在, 但桌面系统还依然有用
嵌入式系统 一般定义 以应用为中心、以计算机技术为基础,软硬件可裁剪,应用系统对功能、可靠性、成本、体积、功耗和应用环境有特殊要求的专用计算机系统。是将应用程序、操作系统和计算机硬件集成在一起的系统(技术角度) 嵌入式系统是设计完成复杂功能的硬件和软件,并使其紧密耦合在一起的计算机系统。(系统角度) 术语嵌入式反映了这些系统通常是更大系统(被称之为嵌入的系统)的一个完整子系统。嵌入式的系统可以包含多个嵌入式系统。 广义定义 任何一个非PC的计算系统
IEEE定义 嵌入式系统是“用于控制、监视或者辅助操作的机器、设备或装置”(原文为devices used to control, monitor, or assist the operation of equipment, machinery or plants)。 通常执行特定功能 嵌入式系统的核心----嵌入式微处理器 严格的时序和稳定性要求 全自动操作循环
微机学会定义 嵌入式系统是以嵌入式应用为目的的计算机系统。可分为系统级、板级、片级 系统级:各种类型的工控机、PC104模块 板级:各种类型的带CPU的主板及OEM产品 片级:各种以单片机、DSP、微处理器为核心的产品
广义上讲,凡是带有微处理器的专用软硬件系统都可称为嵌入式系统。如各类单片机和DSP系统。这些系统在完成较为单一的专业功能时具有简洁高效的特点。但由于他们没有操作系统,管理系统硬件核软件的能力有限,在实现复杂多任务功能时,往往困难重重,甚至无法实现。 从狭义上讲,我们更加强调那些使用嵌入式微处理器构成独立系统,具有自己操作系统,具有特定功能,用于特定场合的嵌入式系统。本课程中的嵌入式系统是指狭义上的嵌入式系统。
DRAM capacity 1000M ~2004 1000 100 10 1 0.1 0.01 0.001 512M 256M 64M 16M Mbit capacity 4M 1M 64K 256K 15K 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000
What is “Computer Architecture” ?
Levels of representation in computers
What is “Instruction Set Architecture (ISA)”? “. . . the attributes of a [computing] system as seen by the programmer, i.e. the conceptual structure and functional behavior, as distinct from the organization of the data flows and controls, the logic design, and the physical implementation.” Amdahl, Blaaw, and Brooks, 1964 ISA includes:- Organization of Programmable Storage Data Types & Data Structures: Encodings & Representations Instruction Formats Instruction (or Operation Code) Set Modes of Addressing and Accessing Data Items and Instructions Exceptional Conditions Remark: G.M.Amdahl was the general system designer of IBM,he proposed this conception in 1964 when he designed the IBM 360 computer.
Instructure Set Architecture (ISA) A very important abstraction interface between hardware and low-level software standardizes instructions, machine language bit patterns, etc. advantage: different implementations of the same architecture disadvantage: sometimes prevents using new innovations Modern instruction set architectures: ARM, 80x86/Pentium/etc, PowerPC, DEC Alpha, MIPS,SPARC, HP
计算机体系结构与计算机组成的区别 •Architecture: 由机器语言或操作系统级的设计者所看到和需要了解的计算机系统的属性,即外特性。 •一般包括8个方面: 1)数据表示:硬件能直接辨认和处理的数据类型 2)寻址方式:最小寻址单元和地址运算问题 3)寄存器定义:操作数、地址、控制等寄存器的定义、数量和使用方式 4)指令系统:机器指令的操作类型和格式、指令间的排序和控制机构等 5)中断机构:中断类型,中断响应中的硬件功能 6)机器工作状态PSW:CPU任务切换,如管态和目 7)输入/输出结构:I/O的连结方式,处理机/存储器与I/O设备间数据传送方式和格式、结束与出错标等 8)数据保护:保护方式和硬件对数据保护的支持等
Computer Organization:在系统结构确定分配给硬件子系统的功能及其概念结构的基础上,研究各组成部分的设计和相互联系,以实现机器指令级的各种功能和特性。 系统结构是对计算机组成的需求分析和功能目标确定 计算机组成则是系统结构的逻辑实现,而计算机实现是指计算机组成的物理设计与实现。 计算机组成的主要研究内容: 数据通路的宽度 专用部件的设置 各功能部件 控制机构的组成方式 缓冲技术 可靠性技术 预估、预判、优化处理
冯•诺依曼结构VS哈佛结构 每个嵌入式系统至少包含一个嵌入式微处理器 嵌入式微处理器体系结构可采用冯•诺依曼(Von Neumann)结构或哈佛(Harvard)结构 指令 程序存储器 CPU PC 地址 数据存储器 MOV r8,#8 数据 地址 数据 主存储器 MOV r8,#8 CPU PC 冯•诺依曼结构 哈佛结构
传统的微处理器采用的冯·诺依曼结构将指令和数据存放在同一存储空间中,统一编址,指令和数据通过同一总线访问。 哈佛结构则是不同于冯·诺依曼结构的一种并行体系结构,其主要特点是程序和数据存储在不同的存储空间中,即程序存储器和数据存储器是两个相互独立的存储器,每个存储器独立编制、独立访问。与之相对应的是系统中设置的两条总线(程序总线和数据总线),从而使数据的吞吐率提高了一倍。
The state in a stored-program digital computer
思考题讲解 举例:如何由由某个任意的时序过程的分析,最终设计出它的门级电路设计 在本节首先讨论如何从状态图得到真值表 状态图 实现方式
真值表
1.2 硬件设计中的抽象 The transistor circuit of a static 2-input CMOS NAND gate
The logic symbol and truth table for a NAND gate
回头再来讨论一下有限状态机到门电路的实现 基于存储器的解决方案 门电路级的硬件实现
1.3 A Very Simple Processor
The MU0 instruction format
The MU0 instruction set
MU0 datapath example
MU0 register transfer level organization
MU0 control logic
MU0 ALU logic for one bit
1.4 指令集的设计 A 4-address instruction format
A 3-address instruction format
A 2-address instruction format
A 1-address (accumulator) instruction format
A 0-address instruction format
1、立即寻址方式 形式地址为常数操作数本身。 1、立即寻址方式 形式地址为常数操作数本身。 操作码 F1 A 操作数=A 2、寄存器(直接)寻址方式 形式地址为存放REG操作数的REG编号。 操作数 通用寄存器 … REG号 操作码 F2 A 操作数=(A) 3、寄存器间接寻址方式 形式地址为存放MEM操作数地址的地址REG编号。 注:地址REG—有基址REG和变址REG两种类型。 程序段 主存 操作数 段内地址 A’ 地址寄存器 … REG号 操作码 F3 A 操作数的EA=(A)
4、直接寻址方式 形式地址为MEM操作数的有效地址。 通常用于单个单元操作和无条件转移指令。 5、间接寻址方式 程序段 主存 操作数 段内地址 操作码 F4 A 操作数的EA=A 5、间接寻址方式 形式地址为存放MEM操作数地址的地址。 因需要两次访存,现在已基本不用。 主存 操作数 段内地址 A’ 操作数的EA=(A)=A’ 操作码 F5 A
有效地址为程序计数器PC内容与偏移量相加的结果。 6、相对寻址方式 有效地址为程序计数器PC内容与偏移量相加的结果。 程序段 主存 目标指令 程序计数器PC XX 操作码 F6 A 操作数的EA=(PC)+A 7、基址寻址方式 有效地址为基址REG内容与偏移量相加的结果。 该寻址方式特别适用于段式存储管理。 程序段 主存 操作数 A’ 基址寄存器 操作码 F7 B A 操作数的EA=(B)+A
8、变址寻址方式 与基址寻址方式类似,区别为使用的是变址REG。 该寻址方式很适用于对程序块规律性处理(如数组)。 9、隐含寻址方式 操作数不显式地在地址码中给出,指令隐含约定(默认)该操作数的存在及位置。如过程调用/返回操作的地址在堆栈中。 操作数类型 常用寻址方式 数据 除相对寻址外,一般均可使用 指令地址 一般使用相对、直接、寄存器间接方式 ☆不同指令系统对寻址方式的命名可能有所不同!
1.5 处理器设计中的权衡 Typical dynamic instruction usage
Superpipeline 、Superscalar、 VLIW(Very Long Instruction Word) Cache Superpipeline 、Superscalar、 VLIW(Very Long Instruction Word) (1)超流水线技术超流水线(superpipeline)技术是RISC采用的一种并行处理技术。它通过细化流水、增加级数和提高主频,使得在每个机器周期内能完成一个甚至两个浮点操作。它的实质是以时间换取空间。超流水机器的特征是在所有的功能单元都采用流水,并有更高的时钟频率和更深的流水深度。由于它只限于指令级的并行,所以超流水机器的CPI值稍高,CPI的含义是每个指令需要的机器周期数(clock cycles per instruction)。不过,它在时钟频率高方面的优点大于其在CPI方面的缺点。 (2)超标量技术超标量(superscalar)技术是RISC采用的又一种并行处理技术。它通过内装多条流水线来同时执行多个处理,其时钟频率虽然与一般流水接近,但它却有更小的CPI。它的实质是以空间换取时间。许多研究人员都曾建议过“多指令分发”(multiple instruction issue)技术,Agerwala和Cocke把这种方法作为RISC思想的扩充,并创造了Supersalar一词。超标量结构正变得越来越复杂。除了指令数目增加外,在执行程序时还要靠硬件来对指令的处理顺序进行动态控制。硬件的复杂性还将随着时钟频率的提高而增加。 (3)超长指令字技术超长指令字(very long instruction word)简称为VILW技术,它由LIW发展而来。VLIW和超标量都是80年代出现的概念,其共同点都是要同时执行多条指令,其不同在于超标量依靠硬件来实现并行处理的调度,VILW则充分发挥软件的作用,而使硬件简化,性能提高。例如,超标量同时分发4条指令已经困难,但是VLIW同时分发8条指令的产品已经指日可待。因此,VLIW有更小的CPI值,但也要有足够高的时钟频率。为使每个功能单元都保持在忙状态,在直线代码序列(straightline code sequence)中必须使经过调度的指令有足够的工作。这是使用跟踪调度(trace scheduling)技术,通过解开循环(unˉrolling loops)和跨过基本块调度代码(scheduling code across basic blocks)来完成的。总之,利用VLIW可以提高指令处理的并行程度,减小CPI,简化控制硬件而可以设置更多的运算器和扩大Cache容量,同时还能提高与内存间数据传输的速率,以便采用更高的时钟频率,使得在超标量潜力已尽的情况下把微处理器的性能再提高2至5倍以上。
Pipelined instruction execution
Read-after-write pipeline hazard
Pipelined branch behaviour
1.6 精简指令集计算机 CISC:复杂指令集(Complex Instruction Set Computer) 具有大量的指令和寻址方式,指令长度可变 8/2原则:80%的程序只使用20%的指令 大多数程序只使用少量的指令就能够运行。 RISC:精简指令集(Reduced Instruction Set Computer) 只包含最有用的指令,指令长度固定 确保数据通道快速执行每一条指令 使CPU硬件结构设计变得更为简单
CISC与RISC的数据通道 CISC:寻址方式复杂 RISC:Load/Store结构 IF ID IF ID ALU MEM REG 开始 退出 微操作通道 CISC:寻址方式复杂 IF ID REG ALU MEM 开始 退出 单通数据通道 RISC:Load/Store结构
CISC的背景和特点 背景: 存储资源紧缺, 强调编译优化 背景: 存储资源紧缺, 强调编译优化 增强指令功能,设置一些功能复杂的指令,把一些原来由软件实现的、常用的功能改用硬件的(微程序)指令系统来实现 为节省存储空间,强调高代码密度,指令格式不固定,指令可长可短,操作数可多可少 寻址方式复杂多样,操作数可来自寄存器,也可来自存储器 采用微程序控制,执行每条指令均需完成一个微指令序列 CPI > 5,指令越复杂,CPI越大。
CISC的主要缺点 指令使用频度不均衡。 高频度使用的指令占据了绝大部分的执行时间,扩充的复杂指令往往是低频度指令。 大量复杂指令的控制逻辑不规整,不适于VLSI工艺 VLSI的出现,使单芯片处理机希望采用规整的硬联逻辑实现,而不希望用微程序,因为微程序的使用反而制约了速度提高。(微码的存控速度比CPU慢5-10倍)。 软硬功能分配 复杂指令增加硬件的复杂度,使指令执行周期大大加长,直接访存次数增多,数据重复利用率低。 不利于先进指令级并行技术的采用 流水线技术
RISC基本设计思想 减小CPI: CPUtime=Instr_Count * CPI * Clock_cycle 精简指令集:保留最基本的,去掉复杂、使用频度不高的指令 采用Load/Store结构,有助于减少指令格式,统一存储器访问方式 采用硬接线控制代替微程序控制 RISC思想的关键不在于减少指令数,而是在于减少执行每条指令所需要的平均周期数CPI。但是,如果只限制于每个周期只发射一条指令的传统的单发射结构,那末,CPI只能接近于1而不能小于1;只有设计出每个周期可发射多条指令的多发射结构,才可能使CPI小于1,或者使每个周期执行的平均指令数IPC大于1。RISC单发射与多发射结构必须是在流水线结构基础上执行指令的。
RISC:减少指令平均执行周期数 CPUtime= Instr_Count *CPI * Clock_cycle IC RISC > IC CISC, 30%---40% CC RISC < CC CISC CPI RISC < CPI CISC , 20% 超标量、超流水线、VLIW等系统结构, 目标在于减小CPI, 可使CPI<1 VLIW是英文“Very Long Instruction Word”的缩写,中文意思是“超长指令集架构”,VLIW架构采用了先进的EPIC(清晰并行指令)设计,我们也把这种构架叫做“IA-64架构”。每时钟周期例如IA-64可运行20条指令,而CISC通常只能运行1-3条指令,RISC能运行4条指令,可见VLIW要比CISC和RISC强大的多。VLIW的最大优点是简化了处理器的结构,删除了处理器内部许多复杂的控制电路,这些电路通常是超标量芯片(CISC和RISC)协调并行工作时必须使用的,VLIW的结构简单,也能够使其芯片制造成本降低,价格低廉,能耗少,而且性能也要比超标量芯片高得多。目前基于这种指令架构的微处理器主要有Intel的IA-64和AMD的x86-64两种。 CC---时钟周期 IC---程序动态执行的指令条数 CPI---指令平均执行周期数
RISC的提出与发展 Load/Store结构提出: CDC6600(1963)--CRAY1(1976) RISC思想最早在IBM公司提出,但不叫RISC,IBM801处理器是公认体现RISC思想的机器。 1980年,Berkeley的Patterson和Dizel提出RISC名词,并研制了RISC-,实验样机。 1981年Stenford的Hennessy研制MIPS芯片。 85年后推出商品化RISC: MIPS1(1986)和SPARC V1(1987)
典型的高性能RISC处理器 SUN公司的SPARC(1987) MIPS公司的SGI:MIPS(1986) HP公司的PA-RISC, IBM, Motorola公司的PowerPC DEC、Compac公司的Alpha AXP IBM的RS6000(1990)第一台Superscalar RISC机 MIPS技术公司是一家设计制造高性能、高档次及嵌入式32位和64位处理器的厂商,在RISC处理器方面占有重要地位。1984年,MIPS计算机公司成立。1992年,SGI收购了MIPS计算机公司。1998年,MIPS脱离SGI,成为MIPS技术公司。 MIPS公司设计RISC处理器始于二十世纪八十年代初,1986年推出R2000处理器,1988年推R3000处理器,1991年推出第一款64位商用微处器R4000。之后又陆续推出R8000(于1994年 )、R10000(于1996年)和R12000(于1997年)等型号。 随后,MIPS公司的战略发生变化,把重点放在嵌入式系统。1999年,MIPS公司发布MIPS32和MIPS64架构标准,为未来MIPS处理器的开发奠定了基础。新的架构集成了所有原来MIPS指令集,并且增加了许多更强大的功能。MIPS公司陆续开发了高性能、低功耗的32位处理器内核(core)MIPS324Kc与高性能64位处理器内核MIPS64 5Kc。2000年,MIPS公司发布了针对MIPS32 4Kc的版本以及64位MIPS 64 20Kc处理器内核。
CISC与RISC的对比 类别 CISC RISC 指令系统 指令数量很多 较少,通常少于100 执行时间 有些指令执行时间很长,如整块的存储器内容拷贝;或将多个寄存器的内容拷贝到存贮器 没有较长执行时间的指令 编码长度 编码长度可变,1-15字节 编码长度固定,通常为4个字节 寻址方式 寻址方式多样 简单寻址 操作 可以对存储器和寄存器进行算术和逻辑操作 只能对寄存器对行算术和逻辑操作,Load/Store体系结构 编译 难以用优化编译器生成高效的目标代码程序 采用优化编译技术,生成高效的目标代码程序
RISC的关键技术 延时转移技术 指令取消技术 重叠寄存器窗口技术 指令流调整技术 转移指令好象被延迟执行了,称为延时(迟)转移技术 指令序列的调整由编译器自动进行 调整指令序列时一定不能改变原来程序的数据相关关系 指令取消技术 在许多情况下找不到可以用来调整的指令,此时采用指令取消技术 重叠寄存器窗口技术 重叠寄存器窗口技术的基本思想:在处理机中设置一个数量比较大的寄存器堆,并把它划分成很多个窗口 指令流调整技术 优化编译器必须分析程序的数据流和控制流。当发现指令流有断流可能时,要调整指令序列
1.7 低功耗设计 CMOS的功耗组成 切换功耗 短路功耗 漏电流
低功耗电路设计 1.降低电源电压 2.降低电路活跃因数A 3.减少门数 4.降低时钟频率
低功耗设计策略 1.降低Vdd 2.降低片外活动度 3.降低片内活动度 4.采用并行技术
作业 1 练习题1.3.1 2 练习题1.3.2