计算机网络 第 7 章 运输层 课件制作人:谢希仁
第 7 章 运输层 *7.2 TCP/IP 体系中的运输层 7.2.1 运输层中的两个协议 7.2.2 端口的概念 第 7 章 运输层 *7.1 运输层协议概述 *7.2 TCP/IP 体系中的运输层 7.2.1 运输层中的两个协议 7.2.2 端口的概念 *7.3 用户数据报协议 UDP 7.3.1 UDP 概述 7.3.2 UDP 用户数据报的首部格式 课件制作人:谢希仁
第 7 章 运输层(续) 7.4 传输控制协议 TCP *7.4.1 TCP 概述 *7.4.2 TCP 报文段的首部 第 7 章 运输层(续) 7.4 传输控制协议 TCP *7.4.1 TCP 概述 *7.4.2 TCP 报文段的首部 *7.4.3 TCP 的数据编号与确认 *7.4.4 TCP 的流量控制与拥塞控制 *7.4.5 TCP 的重传机制 7.4.6 采用随机早期丢弃 RED 进行拥塞控制 *7.4.7 TCP 的运输连接管理 7.4.8 TCP 的有限状态机 课件制作人:谢希仁
7.1 运输层协议概述 从通信和信息处理的角度看,运输层向它上面的应用层提供通信服务,它属于面向通信部分的最高层,同时也是用户功能中的最低层。 面向信息处理 应用层 用户功能 运输层 面向通信 网络层 网络功能 数据链路层 物理层 课件制作人:谢希仁
运输层为相互通信的应用进程提供了逻辑通信 AP1 AP4 5 4 3 2 1 AP2 AP3 5 4 3 2 1 端口 端口 运输层提供应用进程间的逻辑通信 IP 层 主机 A 主机 B 路由器 1 路由器 2 AP1 AP3 LAN1 WAN LAN2 AP2 AP4 IP 协议的作用范围 运输层协议 TCP 和 UDP 的作用范围
应用进程之间的通信 两个主机进行通信实际上就是两个主机中的应用进程互相通信。 应用进程之间的通信又称为端到端的通信。 运输层的一个很重要的功能就是复用和分用。应用层不同进程的报文通过不同的端口向下交到运输层,再往下就共用网络层提供的服务。 “运输层提供应用进程间的逻辑通信”。“逻辑通信”的意思是:运输层之间的通信好像是沿水平方向传送数据。但事实上这两个运输层之间并没有一条水平方向的物理连接。 课件制作人:谢希仁
运输层协议和网络层协议的主要区别 应用进程 应用进程 … … 因 特 网 IP 协议的作用范围 (提供主机之间的逻辑通信) 因 特 网 IP 协议的作用范围 (提供主机之间的逻辑通信) TCP 和 UDP 协议的作用范围 (提供进程之间的逻辑通信) 课件制作人:谢希仁
运输层的主要功能 运输层为应用进程之间提供端到端的逻辑通信(但网络层是为主机之间提供逻辑通信)。 运输层还要对收到的报文进行差错检测。 运输层需要有两种不同的运输协议,即面向连接的 TCP 和无连接的 UDP。 课件制作人:谢希仁
运输层与其上下层之间的关系的 OSI 表示法 主机 A 主机 B 运输服务用户 (应用层实体) 运输服务用户 (应用层实体) 应用层 运输层服务访问点 TSAP 层接口 运输实体 运输协议 运输实体 运输层 层接口 网络层 (或网际层) 网络层服务访问点 NSAP 课件制作人:谢希仁
运输层向上提供可靠的和不可靠的逻辑通信信道 应 用 层 发 送 进 程 接 收 进 程 发 送 进 程 接 收 进 程 ? 数据 数据 数据 数据 运 输 层 全双工可靠信道 不可靠信道 使用 TCP 协议 使用 UDP 协议
7.2 TCP/IP 体系中的运输层 7.2.1 运输层中的两个协议 (1) 用户数据报协议 UDP (User Datagram Protocol) (2) 传输控制协议 TCP (Transmission Control Protocol) 课件制作人:谢希仁
TCP 与 UDP 两个对等运输实体在通信时传送的数据单位叫作运输协议数据单元 TPDU (Transport Protocol Data Unit)。 TCP 传送的数据单位协议是 TCP 报文段(segment) UDP 传送的数据单位协议是 UDP 报文或用户数据报。 课件制作人:谢希仁
TCP/IP 体系中的运输层协议 应用层 运输层 UDP TCP IP 与各种网络接口 课件制作人:谢希仁
TCP 与 UDP UDP 在传送数据之前不需要先建立连接。对方的运输层在收到 UDP 报文后,不需要给出任何确认。虽然 UDP 不提供可靠交付,但在某些情况下 UDP 是一种最有效的工作方式。 TCP 则提供面向连接的服务。TCP 不提供广播或多播服务。由于 TCP 要提供可靠的、面向连接的运输服务,因此不可避免地增加了许多的开销。这不仅使协议数据单元的首部增大很多,还要占用许多的处理机资源。 课件制作人:谢希仁
还要强调两点 运输层的 UDP 用户数据报与网际层的IP数据报有很大区别。IP 数据报要经过互连网中许多路由器的存储转发,但 UDP 用户数据报是在运输层的端到端抽象的逻辑信道中传送的。 TCP 报文段是在运输层抽象的端到端逻辑信道中传送,这种信道是可靠的全双工信道。但这样的信道却不知道究竟经过了哪些路由器,而这些路由器也根本不知道上面的运输层是否建立了 TCP 连接。 课件制作人:谢希仁
7.2.2 端口的概念 端口就是运输层服务访问点 TSAP。 7.2.2 端口的概念 端口就是运输层服务访问点 TSAP。 端口的作用就是让应用层的各种应用进程都能将其数据通过端口向下交付给运输层,以及让运输层知道应当将其报文段中的数据向上通过端口交付给应用层相应的进程。 从这个意义上讲,端口是用来标志应用层的进程。 课件制作人:谢希仁
端口在进程之间的通信中所起的作用 发送方 接收方 应用进程 应用进程 应 用 层 端口 端口 运 输 层 TCP 复用 UDP 复用 TCP 分用 UDP 分用 UDP 用户数据报 UDP 用户数据报 TCP 报文段 TCP 报文段 网 络 层 IP 复用 IP 分用 IP 数据报 IP 数据报
端口 端口用一个 16 bit 端口号进行标志。 端口号只具有本地意义,即端口号只是为了标志本计算机应用层中的各进程。在因特网中不同计算机的相同端口号是没有联系的。 课件制作人:谢希仁
两类端口 一类是熟知端口,其数值一般为 0~1023。当一种新的应用程序出现时,必须为它指派一个熟知端口。 另一类则是一般端口,用来随时分配给请求通信的客户进程。 课件制作人:谢希仁
插口(socket) TCP 使用“连接”(而不仅仅是“端口”)作为最基本的抽象,同时将 TCP 连接的端点称为插口(socket),或套接字、套接口。 插口和端口、IP 地址的关系是: IP 地址 131.6.23.13 端口号 1500 131.6.23.13, 1500 插口(socket) 课件制作人:谢希仁
同一个名词 socket 有多种不同的意思 应用编程接口 API 称为 socket API, 简称为 socket。 调用 socket 函数的端点称为 socket。 调用 socke t函数时其返回值称为 socket描述符,可简称为 socket。 在操作系统内核中连网协议的 Berkeley 实现,称为 socket 实现。 课件制作人:谢希仁
7.3 用户数据报协议 UDP 7.3.1 UDP 概述 UDP 只在 IP 的数据报服务之上增加了很少一点的功能,即端口的功能和差错检测的功能。 虽然 UDP 用户数据报只能提供不可靠的交付,但 UDP 在某些方面有其特殊的优点。 发送数据之前不需要建立连接 UDP 的主机不需要维持复杂的连接状态表。 UDP 用户数据报只有8个字节的首部开销。 网络出现的拥塞不会使源主机的发送速率降低。这对某些实时应用是很重要的。 课件制作人:谢希仁
端口是用报文队列来实现 TFTP 客户 TFTP 服务器 应 用 层 出队列 入队列 出队列 入队列 运 输 层 UDP 端口 51000 UDP 端口 69 UDP 用户数据报 课件制作人:谢希仁
7.3.2 UDP 用户数据报的 首部格式 字节 4 4 1 1 2 源 IP 地址 目的 IP 地址 17 UDP长度 字节 12 2 2 17 UDP长度 字节 12 2 2 2 2 伪首部 源端口 目的端口 长 度 检验和 UDP 用户数据报 首 部 数 据 发送在前 首 部 数 据 IP 数据报 课件制作人:谢希仁
用户数据报 UDP 有两个字段:数据字段和首部字段。首部字段有 8 个字节,由 4 个字段组成,每个字段都是两个字节。 1 1 2 源 IP 地址 目的 IP 地址 17 UDP长度 字节 12 2 2 2 2 伪首部 源端口 目的端口 长 度 检验和 UDP 用户数据报 首 部 数 据 发送在前 首 部 数 据 IP 数据报
在计算检验和时,临时把“伪首部”和 UDP 用户数据报连接在一起。伪首部仅仅是为了计算检验和。 字节 4 4 1 1 2 源 IP 地址 目的 IP 地址 17 UDP长度 字节 12 2 2 2 2 伪首部 源端口 目的端口 长 度 检验和 UDP 用户数据报 首 部 数 据 发送在前 首 部 数 据 IP 数据报
计算 UDP 检验和的例子 10011001 00010011 → 153.19 00001000 01101000 → 8.104 10101011 00000011 → 171.3 00001110 00001011 → 14.11 00000000 00010001 → 0 和 17 00000000 00001111 → 15 00000100 00111111 → 1087 00000000 00001101 → 13 00000000 00000000 → 0(检验和) 01010100 01000101 → 数据 01010011 01010100 → 数据 01001001 01001110 → 数据 01000111 00000000 → 数据和 0(填充) 10010110 11101101 → 求和得出的结果 01101001 00010010 → 检验和 153.19.8.104 12 字节 伪首部 171.3.14.11 全 0 17 15 1087 13 15 全 0 数据 数据 数据 数据 数据 数据 数据 全 0 8 字节 UDP 首部 7 字节 数据 填充 按二进制反码运算求和 将得出的结果求反码
7.4 传输控制协议 TCP 7.4.1 TCP 概述 TCP TCP 发送端 接收端 应用进程 应用进程 向发送缓存 写入数据块 从接收缓存 读取数据块 … … 端口 端口 TCP TCP 发送缓存 接收缓存 … 报文段 报文段 报文段 发送 TCP 报文段 课件制作人:谢希仁
32 bit TCP 报文段 发送在前 IP 首部 IP 数据部分 比特 0 8 16 24 31 源 端 口 目 的 端 口 序 号 比特 0 8 16 24 31 源 端 口 目 的 端 口 序 号 20 字节的 固定首部 TCP 首部 确 认 号 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 TCP 报文段 TCP 首部 TCP 数据部分 发送在前 IP 首部 IP 数据部分
源端口和目的端口字段——各占 2 字节。端口是运输层与应用层的服务接口。运输层的复用和分用功能都要通过端口才能实现。 比特 0 8 16 24 31 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 确 认 号 TCP 首部 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 源端口和目的端口字段——各占 2 字节。端口是运输层与应用层的服务接口。运输层的复用和分用功能都要通过端口才能实现。
比特 0 8 16 24 31 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 确 认 号 TCP 首部 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 序号字段——占 4 字节。TCP 连接中传送的数据流中的每一个字节都编上一个序号。序号字段的值则指的是本报文段所发送的数据的第一个字节的序号。
确认号字段——占 4 字节,是期望收到对方的下一个报文段的数据的第一个字节的序号。 比特 0 8 16 24 31 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 确 认 号 TCP 首部 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 确认号字段——占 4 字节,是期望收到对方的下一个报文段的数据的第一个字节的序号。
比特 0 8 16 24 31 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 确 认 号 TCP 首部 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 数据偏移——占 4 bit,它指出 TCP 报文段的数据起始处距离 TCP 报文段的起始处有多远。“数据偏移”的单位不是字节而是 32 bit 字(4 字节为计算单位)。
保留字段——占 6 bit,保留为今后使用,但目前应置为 0。 比特 0 8 16 24 31 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 确 认 号 TCP 首部 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 保留字段——占 6 bit,保留为今后使用,但目前应置为 0。
紧急比特 URG —— 当 URG 1 时,表明紧急指针字段有效。它告诉系统此报文段中有紧急数据,应尽快传送(相当于高优先级的数据)。 比特 0 8 16 24 31 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 确 认 号 TCP 首部 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 紧急比特 URG —— 当 URG 1 时,表明紧急指针字段有效。它告诉系统此报文段中有紧急数据,应尽快传送(相当于高优先级的数据)。
确认比特 ACK —— 只有当 ACK 1 时确认号字段才有效。当 ACK 0 时,确认号无效。 比特 0 8 16 24 31 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 确 认 号 TCP 首部 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 确认比特 ACK —— 只有当 ACK 1 时确认号字段才有效。当 ACK 0 时,确认号无效。
比特 0 8 16 24 31 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 确 认 号 TCP 首部 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 推送比特 PSH (PuSH) —— 接收 TCP 收到推送比特置 1 的报文段,就尽快地交付给接收应用进程,而不再等到整个缓存都填满了后再向上交付。
比特 0 8 16 24 31 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 确 认 号 TCP 首部 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 复位比特 RST (ReSeT) —— 当 RST 1 时,表明 TCP 连接中出现严重差错(如由于主机崩溃或其他原因),必须释放连接,然后再重新建立运输连接。
同步比特 SYN —— 同步比特 SYN 置为 1,就表示这是一个连接请求或连接接受报文。 比特 0 8 16 24 31 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 确 认 号 TCP 首部 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 同步比特 SYN —— 同步比特 SYN 置为 1,就表示这是一个连接请求或连接接受报文。
终止比特 FIN (FINal) —— 用来释放一个连接。当FIN 1 时,表明此报文段的发送端的数据已发送完毕,并要求释放运输连接。 比特 0 8 16 24 31 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 确 认 号 TCP 首部 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 终止比特 FIN (FINal) —— 用来释放一个连接。当FIN 1 时,表明此报文段的发送端的数据已发送完毕,并要求释放运输连接。
比特 0 8 16 24 31 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 确 认 号 TCP 首部 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 窗口字段 —— 占 2 字节。窗口字段用来控制对方发送的数据量,单位为字节。TCP 连接的一端根据设置的缓存空间大小确定自己的接收窗口大小,然后通知对方以确定对方的发送窗口的上限。
检验和 —— 占 2 字节。检验和字段检验的范围包括首部和数据这两部分。在计算检验和时,要在 TCP 报文段的前面加上 12 字节的伪首部。 比特 0 8 16 24 31 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 确 认 号 TCP 首部 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 检验和 —— 占 2 字节。检验和字段检验的范围包括首部和数据这两部分。在计算检验和时,要在 TCP 报文段的前面加上 12 字节的伪首部。
紧急指针字段 —— 占 16 bit。紧急指针指出:在本报文段中紧急数据共有多少个字节(紧急数据放在本报文段数据的最前面)。 比特 0 8 16 24 31 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 确 认 号 TCP 首部 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 紧急指针字段 —— 占 16 bit。紧急指针指出:在本报文段中紧急数据共有多少个字节(紧急数据放在本报文段数据的最前面)。
MSS 是 TCP 报文段中的数据字段的最大长度。 比特 0 8 16 24 31 源 端 口 目 的 端 口 MSS 是 TCP 报文段中的数据字段的最大长度。 数据字段加上 TCP 首部 才等于整个的 TCP 报文段。 序 号 20 字节 固定 首部 确 认 号 TCP 首部 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 选项字段 —— 长度可变。TCP 只规定了一种选项,即最大报文段长度 MSS (Maximum Segment Size)。MSS 告诉对方 TCP:“我的缓存所能接收的报文段的数据字段的最大长度是 MSS 个字节。”
填充字段 —— 这是为了使整个首部长度是 4 字节的整数倍。 比特 0 8 16 24 31 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 确 认 号 TCP 首部 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 填充字段 —— 这是为了使整个首部长度是 4 字节的整数倍。
7.4.3 TCP 的数据编号与确认 TCP 协议是面向字节的。TCP 将所要传送的报文看成是字节组成的数据流,并使每一个字节对应于一个序号。 在连接建立时,双方要商定初始序号。TCP 每次发送的报文段的首部中的序号字段数值表示该报文段中的数据部分的第一个字节的序号。 TCP 的确认是对接收到的数据的最高序号表示确认。接收端返回的确认号是已收到的数据的最高序号加 1。因此确认号表示接收端期望下次收到的数据中的第一个数据字节的序号。 课件制作人:谢希仁
7.4.4 TCP 的流量控制与拥塞控制 1. 滑动窗口的概念 发送窗口在连接建立时由双方商定。但在通信的过程中,接收端可根据自己的资源情况,随时动态地调整对方的发送窗口上限值(可增大或减小)。 课件制作人:谢希仁
发送端要发送 900 字节长的数据,划分为 9 个 100 字节长的报文段,而发送窗口确定为 500 字节。 收到确认即可前移 1 100 101 200 201 300 301 400 401 500 501 600 601 700 701 800 801 900 指针 可发送 不可发送 发送端要发送 900 字节长的数据,划分为 9 个 100 字节长的报文段,而发送窗口确定为 500 字节。 发送端只要收到了对方的确认,发送窗口就可前移。 发送 TCP 要维护一个指针。每发送一个报文段,指针就向前移动一个报文段的距离。
发送端已发送了 400 字节的数据,但只收到对前 200 字节数据的确认,同时窗口大小不变。 现在发送端还可发送 300 字节。 发送窗口 收到确认即可前移 1 100 101 200 201 300 301 400 401 500 501 600 601 700 701 800 801 900 指针 可发送 不可发送 发送窗口前移 1 100 101 200 201 300 301 400 401 500 501 600 601 700 701 800 801 900 指针 已发送 并被确认 已发送但 未被确认 可发送 不可发送 发送端已发送了 400 字节的数据,但只收到对前 200 字节数据的确认,同时窗口大小不变。 现在发送端还可发送 300 字节。
发送端收到了对方对前 400 字节数据的确认,但对方通知发送端必须把窗口减小到 400 字节。 现在发送端最多还可发送 400 字节的数据。 发送窗口前移 1 100 101 200 201 300 301 400 401 500 501 600 601 700 701 800 801 900 已发送 并被确认 已发送但 未被确认 可发送 不可发送 指针 发送窗口缩小 1 100 101 200 201 300 301 400 401 500 501 600 601 700 701 800 801 900 已发送 并被确认 不可 发送 可发送 指针
利用可变窗口大小进行流量控制 双方确定的窗口值是 400 主机 A 主机 B SEQ = 1 A 还能发送 300 字节 SEQ = 101 A 还能发送 200 字节 SEQ = 201 丢失! ACK = 201, WIN = 300 允许 A 再发送 300 字节(序号 201 至 500) SEQ = 301 A 还能发送 200 字节(序号 301 至 500) SEQ = 401 A 还能发送 100 字节(序号 401 至 500) SEQ = 201 A 超时重发,但不能发送序号 500 以后的数据 ACK = 501, WIN = 200 允许 A 再发送 200 字节(序号 501 至 700) SEQ = 501 A 还能发送 100 字节(序号 501 至 700) ACK = 601, WIN = 0 不允许 A 再发送(到序号 600 的数据都已收到)
2. 慢开始和拥塞避免 发送端的主机在确定发送报文段的速率时,既要根据接收端的接收能力,又要从全局考虑不要使网络发生拥塞。 2. 慢开始和拥塞避免 发送端的主机在确定发送报文段的速率时,既要根据接收端的接收能力,又要从全局考虑不要使网络发生拥塞。 因此,每一个 TCP 连接需要有以下两个状态变量: 接收端窗口 rwnd (receiver window) 又称为通知窗口(advertised window)。 拥塞窗口 cwnd (congestion window)。 课件制作人:谢希仁
接收端窗口 rwnd 和 拥塞窗口 cwnd (1) 接收端窗口 rwnd 这是接收端根据其目前的接收缓存大小所许诺的最新的窗口值,是来自接收端的流量控制。接收端将此窗口值放在 TCP 报文的首部中的窗口字段,传送给发送端。 (2) 拥塞窗口 cwnd (congestion window) 是发送端根据自己估计的网络拥塞程度而设置的窗口值,是来自发送端的流量控制。 课件制作人:谢希仁
发送窗口的上限值 发送端的发送窗口的上限值应当取为接收端窗口 rwnd 和拥塞窗口 cwnd 这两个变量中较小的一个,即应按以下公式确定: 发送窗口的上限值 Min [rwnd, cwnd] (7-1) 当 rwnd < cwnd 时,是接收端的接收能力限制发送窗口的最大值。 当 cwnd < rwnd 时,则是网络的拥塞限制发送窗口的最大值。 课件制作人:谢希仁
慢开始算法的原理 在主机刚刚开始发送报文段时可先将拥塞窗口 cwnd 设置为一个最大报文段 MSS 的数值。 课件制作人:谢希仁
慢开始和拥塞避免算法的实现举例 当 TCP 连接进行初始化时,将拥塞窗口置为 1。图中的窗口单位不使用字节而使用报文段。 拥塞窗口 cwnd 发生超时 线性规律增长 24 20 进入拥塞避免 进入拥塞避免 16 ssthresh = 16 12 更新后的 ssthresh = 12 8 4 指数规律增长 传输次数 2 4 6 8 10 12 14 16 18 20 22 慢开始 拥塞避免 慢开始 拥塞避免 当 TCP 连接进行初始化时,将拥塞窗口置为 1。图中的窗口单位不使用字节而使用报文段。 慢开始门限的初始值设置为 16 个报文段, 即 ssthresh = 16。
慢开始和拥塞避免算法的实现举例 拥塞窗口 cwnd 发生超时 线性规律增长 24 20 进入拥塞避免 进入拥塞避免 16 ssthresh = 16 12 更新后的 ssthresh = 12 8 4 指数规律增长 传输次数 2 4 6 8 10 12 14 16 18 20 22 慢开始 拥塞避免 慢开始 拥塞避免 发送端的发送窗口不能超过拥塞窗口 cwnd 和接收端窗口 rwnd 中的最小值。我们假定接收端窗口足够大,因此现在发送窗口的数值等于拥塞窗口的数值。
慢开始和拥塞避免算法的实现举例 在执行慢开始算法时,拥塞窗口 cwnd 的初始值为 1,发送第一个报文段 M0。 拥塞窗口 cwnd 发生超时 线性规律增长 24 20 进入拥塞避免 进入拥塞避免 16 ssthresh = 16 12 更新后的 ssthresh = 12 8 4 指数规律增长 传输次数 2 4 6 8 10 12 14 16 18 20 22 慢开始 拥塞避免 慢开始 拥塞避免 在执行慢开始算法时,拥塞窗口 cwnd 的初始值为 1,发送第一个报文段 M0。
慢开始和拥塞避免算法的实现举例 拥塞窗口 cwnd 发生超时 线性规律增长 24 20 进入拥塞避免 进入拥塞避免 16 ssthresh = 16 12 更新后的 ssthresh = 12 8 4 指数规律增长 传输次数 2 4 6 8 10 12 14 16 18 20 22 慢开始 拥塞避免 慢开始 拥塞避免 发送端收到 ACK1 (确认 M0,期望收到 M1)后,将 cwnd 从 1 增大到 2,于是发送端可以接着发送 M1 和 M2 两个报文段。
慢开始和拥塞避免算法的实现举例 拥塞窗口 cwnd 发生超时 线性规律增长 24 20 进入拥塞避免 进入拥塞避免 16 ssthresh = 16 12 更新后的 ssthresh = 12 8 4 指数规律增长 传输次数 2 4 6 8 10 12 14 16 18 20 22 慢开始 拥塞避免 慢开始 拥塞避免 接收端发回 ACK2 和 ACK3。发送端每收到一个对新报文段的确认 ACK,就把发送端的拥塞窗口加 1。现在发送端的 cwnd 从 2 增大到 4,并可发送 M4 ~ M6共 4个报文段。
慢开始和拥塞避免算法的实现举例 拥塞窗口 cwnd 发生超时 线性规律增长 24 20 进入拥塞避免 进入拥塞避免 16 ssthresh = 16 12 更新后的 ssthresh = 12 8 4 指数规律增长 传输次数 2 4 6 8 10 12 14 16 18 20 22 慢开始 拥塞避免 慢开始 拥塞避免 发送端每收到一个对新报文段的确认 ACK,就把发送端的拥塞窗口加 1,因此拥塞窗口 cwnd 随着传输次数按指数规律增长。
慢开始和拥塞避免算法的实现举例 拥塞窗口 cwnd 发生超时 线性规律增长 拥塞避免 24 20 进入拥塞避免 进入拥塞避免 16 ssthresh = 16 12 更新后的 ssthresh = 12 8 4 指数规律增长 传输次数 2 4 6 8 10 12 14 16 18 20 22 慢开始 慢开始 拥塞避免 当拥塞窗口 cwnd 增长到慢开始门限值 ssthresh 时(即当 cwnd = 16 时),就改为执行拥塞避免算法,拥塞窗口按线性规律增长。
慢开始和拥塞避免算法的实现举例 假定拥塞窗口的数值增长到 24 时,网络出现超时(表明网络拥塞了)。 拥塞窗口 cwnd 发生超时 线性规律增长 24 20 进入拥塞避免 进入拥塞避免 16 ssthresh = 16 12 更新后的 ssthresh = 12 8 4 指数规律增长 传输次数 2 4 6 8 10 12 14 16 18 20 22 慢开始 拥塞避免 慢开始 拥塞避免 假定拥塞窗口的数值增长到 24 时,网络出现超时(表明网络拥塞了)。
慢开始和拥塞避免算法的实现举例 拥塞窗口 cwnd 发生超时 线性规律增长 24 20 进入拥塞避免 进入拥塞避免 16 ssthresh = 16 12 更新后的 ssthresh = 12 8 4 指数规律增长 传输次数 2 4 6 8 10 12 14 16 18 20 22 慢开始 拥塞避免 慢开始 拥塞避免 更新后的 ssthresh 值变为 12(即发送窗口数值 24 的一半),拥塞窗口再重新设置为 1,并执行慢开始算法。
慢开始和拥塞避免算法的实现举例 拥塞窗口 cwnd 发生超时 线性规律增长 24 20 进入拥塞避免 进入拥塞避免 16 ssthresh = 16 12 更新后的 ssthresh = 12 8 4 指数规律增长 传输次数 2 4 6 8 10 12 14 16 18 20 22 慢开始 拥塞避免 慢开始 拥塞避免 当 cwnd = 12 时改为执行拥塞避免算法,拥塞窗口按按线性规律增长,每经过一个往返时延就增加一个 MSS 的大小。
乘法减小 (multiplicative decrease) “乘法减小“是指不论在慢开始阶段还是拥塞避免阶段,只要出现一次超时(即出现一次网络拥塞),就把慢开始门限值 ssthresh 设置为当前的拥塞窗口值乘以 0.5。 当网络频繁出现拥塞时,ssthresh 值就下降得很快,以大大减少注入到网络中的分组数。 课件制作人:谢希仁
加法增大 (additive increase) “加法增大”是指执行拥塞避免算法后,当收到对所有报文段的确认就将拥塞窗口 cwnd增加一个 MSS 大小,使拥塞窗口缓慢增大,以防止网络过早出现拥塞。 课件制作人:谢希仁
必须强调指出 “拥塞避免”并非指完全能够避免了拥塞。利用以上的措施要完全避免网络拥塞还是不可能的。 “拥塞避免”是说在拥塞避免阶段把拥塞窗口控制为按线性规律增长,使网络比较不容易出现拥塞。 课件制作人:谢希仁
3. 快重传和快恢复 快重传算法规定,发送端只要一连收到三个重复的 ACK 即可断定有分组丢失了,就应立即重传丢失的报文段而不必继续等待为该报文段设置的重传计时器的超时。 不难看出,快重传并非取消重传计时器,而是在某些情况下可更早地重传丢失的报文段。 课件制作人:谢希仁
快重传举例 主机 A 主机 B M1, M2 A 发送 M1 和 M2 ACK2, ACK3 B 确认 M1 和 M2 M3 丢失! B 发送第二个重复确认 ACK3 M6 A 发送 M6 ACK3 B 发送第三个重复确认 ACK3 M3 A 收到了三个重复的确认 ACK3,就立即重传 M3,而不必等待超时重传。
快恢复算法 (1) 当发送端收到连续三个重复的 ACK 时,就重新设置慢开始门限 ssthresh。 (2) 与慢开始不同之处是拥塞窗口 cwnd 不是设置为 1,而是设置为 ssthresh + 3 MSS。 (3) 若收到的重复的 ACK 为 n 个(n > 3),则将 cwnd 设置为 ssthresh + n MSS。 (4) 若发送窗口值还容许发送报文段,就按拥塞避免算法继续发送报文段。 (5) 若收到了确认新的报文段的 ACK,就将 cwnd 缩小到 ssthresh。 课件制作人:谢希仁
7.4.5 TCP 的重传机制 重传机制是 TCP 中最重要和最复杂的问题之一。 课件制作人:谢希仁
往返时延的方差很大 由于 TCP 的下层是一个互连网环境,IP 数据报所选择的路由变化很大。因而运输层的往返时延的方差也很大。 往返时延的 概率分布 数据链路层 运输层 时间 T1 T2 T3 课件制作人:谢希仁
往返时延的自适应算法 记录每一个报文段发出的时间,以及收到相应的确认报文段的时间。这两个时间之差就是报文段的往返时延。 将各个报文段的往返时延样本加权平均,就得出报文段的平均往返时延 RTT。 每测量到一个新的往返时延样本,就按下式重新 计算一次平均往返时延 RTT: 平均往返时延RTT (旧的RTT) (1 ) (新的往返时延样本) (7-2) 在上式中,0 1。
参数 的选择 若 很接近于 1,表示新算出的平均往返时延 RTT 和原来的值相比变化不大,而新的往返时延样本的影响不大(RTT 值更新较慢)。 若选择 接近于零,则表示加权计算的平均往返时延 RTT 受新的往返时延样本的影响较大(RTT 值更新较快)。 典型的 值为 7/8。 课件制作人:谢希仁
超时重传时间 RTO (RetransmissionTime-Out) 计时器的 RTO 应略大于上面得出的 RTT,即: RTO RTT (7-3) 这里 是个大于 1 的系数。 若取 很接近于1 ,发送端可及时地重传丢失的报文段,因此效率得到提高。 但若报文段并未丢失而仅仅是增加了一点时延,那么过早地重传反而会加重网络的负担。 因此 TCP 原先的标准推荐将 值取为 2。 课件制作人:谢希仁
往返时间的测量相当复杂 TCP 报文段 1 没有收到确认。重传(即报文段 2)后,收到了确认报文段 ACK。 如何判定此确认报文段是对原来的报文段 1 的确认,还是对重传的报文段 2 的确认? 是对哪一个报文段 的确认? 发送一个 TCP 报文段 超时重传 TCP 报文段 收到 ACK 1 2 时间 往返时延 RTT? 往返时延 RTT? 课件制作人:谢希仁
Karn 算法 在计算平均往返时延 RTT 时,只要报文段重传了,就不采用其往返时延样本。 课件制作人:谢希仁
修正的 Karn 算法 报文段每重传一次,就将重传时间增大一些: 新的重传时间 (旧的重传时间) (7-4) 新的重传时间 (旧的重传时间) (7-4) 系数 的典型值是2 。 当不再发生报文段的重传时,才根据报文段的往返时延更新平均往返时延 RTT 和重传时间的数值。 实践证明,这种策略较为合理。 课件制作人:谢希仁
7.4.6 随机早期丢弃 RED (Random Early Discard) 使路由器的队列维持两个参数,即队列长度最小门限 THmin 和最大门限 THmax。 RED 对每一个到达的数据报都先计算平均队列长度 LAV。 若平均队列长度小于最小门限 THmin,则将新到达的数据报放入队列进行排队。 若平均队列长度超过最大门限 THmax,则将新到达的数据报丢弃。 若平均队列长度在最小门限 THmin 和最大门限THmax 之间,则按照某一概率 p 将新到达的数据报丢弃。
RED 将路由器的到达队列 划分成为三个区域 丢弃 以概率 p 丢弃 排队 数据报 到达 从队首 发送 最小门限 THmin 平均队列长度 Lav 最大门限 THmin 课件制作人:谢希仁
丢弃概率 p 与 THmin 和 Thmax 的关系 当 LAV Thmin 时,丢弃概率 p = 0。 当 LAV Thmax 时,丢弃概率 p = 1。 当 THmin LAV THmax时, 0 p 1 。 例如,按线性规律变化,从 0 变到 pmax。 数据报丢弃概率 p 1.0 pmax 平均队列长度 Lav 最小门限 THmin 最大门限 THmax 课件制作人:谢希仁
瞬时队列长度和 平均队列长度的区别 队列长度 瞬时队列长度 平均队列长度 时间 课件制作人:谢希仁
7.4.7 TCP 的运输连接管理 1. 运输连接的三个阶段 运输连接就有三个阶段,即:连接建立、数据传送和连接释放。运输连接的管理就是使运输连接的建立和释放都能正常地进行。 连接建立过程中要解决以下三个问题: 要使每一方能够确知对方的存在。 要允许双方协商一些参数(如最大报文段长度,最大窗口大小,服务质量等)。 能够对运输实体资源(如缓存大小,连接表中的项目等)进行分配。 课件制作人:谢希仁
客户服务器方式 TCP 连接的建立都是采用客户服务器方式。 主动发起连接建立的应用进程叫做客户(client)。 被动等待连接建立的应用进程叫做服务器(server)。 课件制作人:谢希仁
用三次握手建立 TCP 连接 主机 A 主机 B 主动打开 被动打开 SYN, SEQ = x 连接请求 SYN, ACK, SEQ = y, ACK= x 1 确认 ACK, SEQ = x + 1, ACK = y 1 确认 课件制作人:谢希仁
建立 TCP 连接 A 的 TCP 向 B 发出连接请求报文段,其首部中的同步比特 SYN 应置为 1,并选择序号 x,表明传送数据时的第一个数据字节的序号是 x。 B 的 TCP 收到连接请求报文段后,如同意,则发回确认。 B 在确认报文段中应将 SYN 置为 1,其确认号应为 x 1,同时也为自己选择序号 y。 A 收到此报文段后,向 B 给出确认,其确认号应为 y 1。 A 的 TCP 通知上层应用进程,连接已经建立。 当运行服务器进程的主机 B 的 TCP 收到主机 A 的确认后,也通知其上层应用进程,连接已经建立。
从 A 到 B 的连接就释放了,连接处于半关闭状态。 至此,整个连接已经全部释放。 TCP 连接释放的过程 主机 A 主机 B 应用进程 释放连接 B 不再发送报文 ② 通知主机 应用进程 ① 应用进程 释放连接 A 不再发送报文 FIN, SEQ = x ACK, SEQ = y, ACK= x 1 确认 从 A 到 B 的连接就释放了,连接处于半关闭状态。 相当于 A 向 B 说: “我已经没有数据要发送了。 但你如果还发送数据,我仍接收。” FIN, ACK, SEQ = y, ACK = x + 1 ACK, SEQ = x + 1, ACK = y 1 确认 课件制作人:谢希仁
7.4.8 TCP 的有限状态机 为了管理因特网,在网络管理中心设有管理信息库 MIB (Management Information Base)。 管理信息库存放着各主机的 TCP 连接表。 TCP 连接表对每个连接都登记了其连接信息。除本地和远地的 IP 地址和端口号外,还要记录每一个连接所处的状态。 连接状态 本地 IP 地址 本地端口 远地 IP 地址 远地端口 连接 1 连接 2 连接 n
TCP 的 有 限 状 态 机 起点 CLOSED 被动打开 主动打开 发送 SYN 关闭 收到 SYN 发送 SYN, ACK LISTEN TCP 的 有 限 状 态 机 被动打开 收到 RST 发送 SYN 关闭 或超时 收到 SYN,发送 SYN, ACK SYN_RCVD SYN_SENT 同时打开 主动打开 收到 ACK 收到 SYN, ACK 发送 ACK 数据传送 阶段 收到 FIN 发送 ACK 被动关闭 关闭 发送 FIN ESTABLISHED CLOSE_WAIT 关闭 发送 FIN 主动关闭 关闭 发送 FIN 收到 FIN 发送 ACK 同时关闭 FIN_WAIT_1 CLOSING 收到 ACK 收到 FIN, ACK 发送 ACK LAST_ACK 收到 ACK 收到 ACK 收到 FIN 发送 ACK FIN_WAIT_2 TIME_WAIT 定时经过两倍报文段寿命后
TCP 的正常的连接建立和关闭 客户进程 服务器进程 LISTEN(被动打开) SYN, SEQ = x (主动打开) SYN_SENT SYN_RCVD SYN, ACK, SEQ = y, ACK = x + 1 ESTABLISHED SYN_RCVD ACK, SEQ = x + 1, ACK = y + 1 ESTABLISHED ESTABLISHED (全双工数据传送阶段) FIN, SEQ = u (主动关闭) FIN_WAIT_1 CLOSE_WAIT ( 被动关闭) ACK, SEQ = v, ACK = u + 1 FIN_WAIT_2 CLOSE_WAIT FIN, ACK, SEQ = v, ACK = u + 1 TIME_WAIT LAST_ACK ACK, SEQ = u + 1, ACK = v + 1 TIME_WAIT CLOSED