8.1 CPU 的结构 8.3 指令流水 8.2 指令周期 8.4 中断系统
8.1 CPU 的结构 一、 CPU 的功能 1. 控制器的功能 取指令 指令控制 分析指令 操作控制 执行指令,发出各种操作命令 时间控制 1. 控制器的功能 取指令 指令控制 分析指令 操作控制 执行指令,发出各种操作命令 时间控制 控制程序输入及结果的输出 总线管理 处理中断 处理异常情况和特殊请求 数据加工 2. 运算器的功能 实现算术运算和逻辑运算
二、CPU 结构框图 1. CPU 与系统总线 指令控制 操作控制 时间控制 数据加工 处理中断 PC IR CU 时序电路 ALU 寄存器 中断系统 CPU 控制总线 数据总线 地址总线 ALU 寄存器 中断 系统 CU
2. CPU 的内部结构 算术和 布尔逻辑 取反 移位 状态标志 内部 数据总线 C P U 寄存器 CU 中断 系统 ALU 控制信号 …
三、 CPU 的寄存器 1. 用户可见寄存器 (1) 通用寄存器 存放操作数 可作 某种寻址方式所需的 专用寄存器 (2) 数据寄存器 存放操作数(满足各种数据类型) 两个寄存器拼接存放双倍字长数据 (3) 地址寄存器 存放地址,其位数应满足最大的地址范围 用于特殊的寻址方式 段基值 栈指针 (4) 条件码寄存器 存放条件码,可作程序分支的依据 如 正、负、零、溢出、进位等
2. 控制和状态寄存器 (1) 控制寄存器 PC MAR M MDR IR 控制 CPU 操作 其中 MAR MDR IR 用户不可见 PC 用户可见 (2) 状态寄存器 状态寄存器 存放条件码 PSW 寄存器 存放程序状态字 3. 举例 Z8000 8086 MC 68000
四、 控制单元 CU 和中断系统 1. CU 产生全部指令的微操作命令序列 组合逻辑设计 微程序设计 硬连线逻辑 存储逻辑 参见 第四篇 2. 中断系统 参见 8.4 五、ALU 参见 第六章
8.2 指 令 周 期 一、 指令周期的基本概念 1 . 指令周期 取出并执行一条指令所需的全部时间 取指、分析 取指周期 完成一条指令 8.2 指 令 周 期 一、 指令周期的基本概念 1 . 指令周期 取出并执行一条指令所需的全部时间 取指、分析 取指周期 完成一条指令 执行 执行周期 取指阶段 取指周期 执行阶段 执行周期 (取指、分析) (执行指令) 指令周期
NOP ADD mem MUL mem 2. 每条指令的指令周期不同 取指周期 指令周期 取指周期 执行阶段 指令周期 取指周期 执行周期 2. 每条指令的指令周期不同 取指周期 指令周期 NOP 取指周期 执行阶段 指令周期 ADD mem 取指周期 执行周期 指令周期 MUL mem
3. 具有间接寻址的指令周期 取指周期 间址周期 指令周期 执行周期 4. 带有中断周期的指令周期 取指周期 间址周期 指令周期 执行周期 中断周期
5. 指令周期流程 否 取指周期 有间址吗? 是 间址周期 否 执行周期 有中断吗? 是 中断周期
FE IND INT 6. CPU 工作周期的标志 CPU 访存有 4 种性质 取 指令 取指周期 取 地址 间址周期 CPU 的 取 指令 取指周期 取 地址 间址周期 CPU 的 4个工作周期 取 操作数 执行周期 中断周期 存 程序断点 FE D IND INT CLK 1 EX
二、 指令周期的数据流 存储器 CPU 地址总线 数据总线 控制总线 1. 取指周期数据流 PC MAR +1 CU IR IR MDR
2. 间址周期数据流 MDR CU MAR CPU 地址总线 数据总线 控制总线 PC IR 存储器 MDR
3. 执行周期数据流 不同指令的执行周期数据流不同 MDR CU MAR CPU 地址总线 数据总线 控制总线 PC 存储器 4 . 中断周期数据流
8.3 指 令 流 水 一、如何提高机器速度 1. 提高访存速度 高速芯片 Cache 多体并行 2. 提高 I/O 和主机之间的传送速度 8.3 指 令 流 水 一、如何提高机器速度 1. 提高访存速度 高速芯片 Cache 多体并行 2. 提高 I/O 和主机之间的传送速度 中断 DMA 通道 多总线 I/O 处理机 3. 提高运算器速度 高速芯片 改进算法 快速进位链 提高整机处理能力 高速器件 改进系统结构 ,开发系统的并行性
二、系统的并行性 1. 并行的概念 并发 同时 两个或两个以上事件在 同一时间段 发生 并行 两个或两个以上事件在 同一时刻 发生 时间上互相重叠 2. 并行性的等级 过程级(程序、进程) 粗粒度 软件实现 指令级(指令之间) 细粒度 硬件实现
三、指令流水原理 1. 指令的串行执行 取指令 1 执行指令 1 取指令 2 执行指令 2 取指令 3 执行指令 3 … 取指令 取指令部件 完成 总有一个部件 空闲 执行指令 执行指令部件 完成 2. 指令的二级流水 取指令 1 执行指令 1 取指令 2 执行指令 2 取指令 3 执行指令 3 指令预取 若 取指 和 执行 阶段时间上 完全重叠 指令周期 减半 速度提高 1 倍
猜测法 3. 影响指令流水效率加倍的因素 (1) 执行时间 > 取指时间 取指令 部件 指令部件 缓冲区 执行指令 3. 影响指令流水效率加倍的因素 (1) 执行时间 > 取指时间 取指令 部件 指令部件 缓冲区 执行指令 (2) 条件转移指令 对指令流水的影响 必须等 上条 指令执行结束,才能确定 下条 指令的地址 造成时间损失 猜测法 解决办法 ?
4. 指令的六级流水 1 2 3 4 5 6 7 8 9 10 11 12 13 14 t 完成 一条指令 6 个时间单位 串行执行 4. 指令的六级流水 CO FO EI WO DI FI 指令 1 指令 2 指令 3 指令 4 指令 5 指令 6 指令 7 指令 8 指令 9 1 2 3 4 5 6 7 8 9 10 11 12 13 14 t 完成 一条指令 6 个时间单位 串行执行 6 × 9 = 54 时间单位 六级流水 14 个时间单位
解决办法 …… 三、影响指令流水性能的因素 1. 访存冲突 1 2 3 4 5 6 7 8 9 10 11 12 13 14 t 1. 访存冲突 CO FO EI WO DI FI 指令 1 指令 2 指令 3 指令 4 指令 5 指令 6 指令 7 指令 8 指令 9 1 2 3 4 5 6 7 8 9 10 11 12 13 14 t 解决办法 • 指令存储器和数据存储器分开 指令 1 与指令 4 冲突 指令 2 与指令 5 冲突 指令1、指令3、指令 6 冲突 …… • 指令预取技术 (适用于访存周期短的情况)
BNE 指令必须等 CPX 指令的结果 才能判断出 是转移 还是顺序执行 LDA # 0 LDX # 0 M ADD X, D INX 2. 相关问题 WO EI FO CO DI FI 指令 1 指令 2 指令 3 指令 4 指令 5 指令 6 指令 7 指令15 指令16 1 2 3 4 5 6 7 8 9 10 11 12 13 14 转移损失 t 设 指令3 是转移指令 (1) 控制相关 程序的相近指令之间出现某种关联 使指令流水出现停顿 影响流水线效率 BNE 指令必须等 CPX 指令的结果 才能判断出 是转移 还是顺序执行 LDA # 0 LDX # 0 INX CPX # N BNE M DIV # N STA ANS ADD X, D M
(2) 数据相关 几条相近的指令间,共用 同一存储单元 或 同一寄存器 时,会出现 数据相关 寄存器组 锁存器 ALU ADD R1,R2 如: SUB R1,R3 采用 旁路技术 解决办法
四、流水线的多发技术 t 1. 超标量技术 每个时钟周期内可 并发多条独立指令 配置多个功能部件 不能调整 指令的 执行顺序 1. 超标量技术 每个时钟周期内可 并发多条独立指令 配置多个功能部件 不能调整 指令的 执行顺序 通过编译优化技术,把可并行执行的指令搭配起来 IF ID EX WR 0 1 2 3 4 5 6 7 8 9 10 11 12 13 t
t 2. 超流水技术 在 一个时钟周期 内 再分段 ( 3 段) 在一个时钟周期内 一个功能部件使用多次( 3 次) 2. 超流水技术 在 一个时钟周期 内 再分段 ( 3 段) 在一个时钟周期内 一个功能部件使用多次( 3 次) 不能调整 指令的 执行顺序 靠编译程序解决优化问题 IF ID EX WR 0 1 2 3 4 5 6 7 8 9 10 11 12 13 t 流水线速度是原来速度的 3 倍
t 3. 超长指令字 由编译程序 挖掘 出指令间 潜在 的 并行性, 将 多条 能 并行操作 的指令组合成 一条 3. 超长指令字 具有 多个操作码字段 的 超长指令字(可达几百位) 由编译程序 挖掘 出指令间 潜在 的 并行性, 将 多条 能 并行操作 的指令组合成 一条 采用 多个处理部件 IF ID EX WR 0 1 2 3 4 5 6 7 8 9 10 11 12 13 t
五、流水线结构 1. 指令流水线结构 完成一条指令分 7 段, 每段需一个时钟周期 取指令部件 指令译码部件 地址形成部件 取操作数部件 1. 指令流水线结构 完成一条指令分 7 段, 每段需一个时钟周期 取指令部件 指令译码部件 地址形成部件 取操作数部件 操作执行部件 回写结果部件 修改指令指针部件 锁存 若 流水线不出现断流 1 个时钟周期出 1 结果 不采用流水技术 7 个时钟周期出 1 结果 理想情况下,7 级流水 的速度是不采用流水技术的 7 倍
2. 运算流水线 完成 浮点加减 运算 可分对阶、尾数求和、规格化 三段 锁存器 对阶功能部件 尾数加部件 锁存器 规格化部件 锁存器 2. 运算流水线 完成 浮点加减 运算 可分对阶、尾数求和、规格化 三段 锁存器 对阶功能部件 第一段 尾数加部件 锁存器 第二段 规格化部件 锁存器 第三段 分段原则 每段 操作时间 尽量 一致
8.4 中断系统 …… … 一、概述 1. 引起中断的各种因素 (1) 人为设置的中断 如 转管指令 (2) 程序性事故 1. 引起中断的各种因素 转管指令 …… … 管理程序 (1) 人为设置的中断 如 转管指令 (2) 程序性事故 溢出、操作码不能识别、除法非法 (3) 硬件故障 (4) I/O 设备 (5) 外部事件 用 键盘中断 现行程序
2. 中断系统需解决的问题 (1) 各中断源 如何 向 CPU 提出请求 ? (2) 各中断源 同时 提出 请求 怎么办 ? (3) CPU 什么 条件、什么 时间、以什么 方式 响应中断 ? (4) 如何 保护现场 ? (5) 如何 寻找入口地址 ? (6) 如何 恢复现场,如何 返回 ? (7) 处理中断的过程中又 出现新的中断 怎么办 ? 硬件 + 软件
二、中断请求标记和中断判优逻辑 1. 中断请求标记 INTR 一个请求源 一个 INTR 中断请求标记触发器 多个INTR 组成 中断请求标记寄存器 1 2 3 4 5 n 掉电 过热 阶上溢 内存读写校验错 非法除法 键盘 打印机 INTR 分散 在各个中断源的 接口电路中 INTR 集中 在 CPU 的中断系统 内
① 分散 在各个中断源的 接口电路中 链式排队器 2. 中断判优逻辑 (1) 硬件实现(排队器) ① 分散 在各个中断源的 接口电路中 链式排队器 ② 集中 在 CPU 内 参见 第五章 INTP1 INTP2 INTP3 INTP4 1 1 & 1 & 1 & INTR1 INTR2 INTR3 INTR4 INTR1 、 INTR2 、 INTR3 、 INTR4 优先级 按 降序 排列
(2) 软件实现(程序查询) A、B、C 优先级按 降序 排列 是否 A 请求? 是 转 A 的服务程序 入口地址 否 是否 B 请求? 是 转 B 的服务程序 入口地址 否 是否 C 请求? 是 转 C 的服务程序 入口地址 否 ……
三、中断服务程序入口地址的寻找 1. 硬件向量法 向量地址 形成部件 …… 中断向量 排队器输出 12 H 13 H 14 H JMP 200 JMP 300 JMP 400 主存 入口地址 200 入口地址 300 入口地址 400 12 H 13 H 14 H 主存 向量地址 12H、13H、14H 入口地址 200、 300、 400
M SKP DZ 1# 1# D = 0 跳 JMP 1# SR 1# D = 1 转1# 服务程序 SKP DZ 2# JMP 2# SR 2. 软件查询法 八个中断源 1、2、 8 按 降序 排列 … … 中断识别程序(入口地址 M) 地 址 说 明 指 令 M SKP DZ 1# 1# D = 0 跳 (D为完成触发器) JMP 1# SR 1# D = 1 转1# 服务程序 SKP DZ 2# JMP 2# SR 2# D = 0 跳 2# D = 1 转2# 服务程序 …… SKP DZ 8# JMP 8# SR 8# D = 0 跳 8# D = 1 转8# 服务程序
四、中断响应 1. 响应中断的 条件 允许中断触发器 EINT = 1 2. 响应中断的 时间 指令执行周期结束时刻由CPU 发查询信号 至排队器 INTR1 D Q INTR2 INTRn 中断源 1 中断源 2 中断源 n …… CPU 中断查询
3. 中断隐指令 (1) 保护程序断点 断点存于 特定地址( 0 号地址) 内 断点 进栈 (2) 寻找服务程序入口地址 向量地址 PC (硬件向量法) 中断识别程序 入口地址 M PC (软件查询法) (3) 硬件 关中断 INT S Q R EINT S Q R PC 向量地址 形成部件 INT 中断标记 & 1 … EINT 允许中断 ≥1 … R – S 触发器 排队器
五、保护现场和恢复现场 寄存器 内容 断点 中断隐指令 完成 1. 保护现场 中断服务程序 完成 2. 恢复现场 中断服务程序 完成 保护现场 PUSH 中 断 服 务 程 序 其他服务程序 视不同请求源而定 恢复现场 POP 中断返回 IRET
六、中断屏蔽技术 1. 多重中断的概念 k l m k +1 l +1 m +1 第一次 中断 第二次 第三次 程序断点 k+1 , l+1 , m+1
2. 实现多重中断的条件 (1) 提前 设置 开中断 指令 (2) 优先级别高 的中断源 有权中断优先级别低 的中断源 主程序 A B C D 中断服务程序 ( A、B、 C、 D 优先级按 降序 排列) 中断 请求 B, C D A
3. 屏蔽技术 (1) 屏蔽触发器的作用 1 MASK = 0(未屏蔽) MASKi = 1 (屏蔽) INTR 能被置 “1” & INTP1 INTP2 INTP3 INTP4 INTR1 INTR2 INTR3 INTR4 D INTR MASK Q CPU 查询 1 MASK1 MASK2 MASK3 MASK4 & D Q MASK = 0(未屏蔽) MASKi = 1 (屏蔽) INTR 能被置 “1” INTPi = 0 (不能被排队选中)
(2) 屏蔽字 16个中断源 1、2、3 …… 16 按 降序 排列 优先级 屏 蔽 字 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 …… 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 2 3 4 5 6 15 16
(3) 屏蔽技术可改变优先等级 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 1 0 1 1 1 1 1 1 1 1 1 1 6# 比 5# 优先级高 (4) 屏蔽技术的其他作用 可以 人为地屏蔽 某个中断源的请求 便于程序控制
4. 多重中断的断点保护 中断隐指令 完成 (1) 断点进栈 (2) 断点存入“ 0 ” 地址 中断隐指令 完成 中断周期 0 MAR 命令存储器写 PC MDR 断点 MDR (MDR) 存入存储器 三次中断,三个断点都存入 “ 0 ” 地址 ? 如何保证断点不丢失?
(3) 程序断点存入 “ 0 ” 地址的断点保护 ×××× 5 JMP SERVE SERVE STA SAVE … LDA 0 (3) 程序断点存入 “ 0 ” 地址的断点保护 地 址 内 容 说 明 ×××× 存程序断点 5 JMP SERVE 5 为向量地址 SERVE STA SAVE … 保护现 场 LDA 0 STA RETURN 0 地址内容转存 置屏蔽字 ENI 开中断 其他服务内容 … LDA SAVE 恢复现场 JMP @ RETURN 间址返回 ×××× SAVE 存放 ACC 内容 ×××× RETURN 转存 0 地址内容