Download presentation
Presentation is loading. Please wait.
1
第5章 运输层
2
第 5 章 运输层 5.1.1 进程之间的通信 5.1.2 运输层的两个主要协议 5.1.3 运输层的端口 5.2 用户数据报协议 UDP
第 5 章 运输层 5.1 运输层协议概述 进程之间的通信 运输层的两个主要协议 运输层的端口 5.2 用户数据报协议 UDP UDP 概述 UDP 的首部格式
3
第 5 章 运输层(续) 5.3 传输控制协议 TCP 概述 TCP 最主要的特点 TCP 的连接 5.4 可靠传输的工作原理 停止等待协议 连续 ARQ 协议 5.5 TCP 报文段的首部格式 课件制作人:谢希仁
4
第 5 章 运输层(续) 5.6 TCP 可靠传输的实现 5.6.1 以字节为单位的滑动窗口 5.6.2 超时重传时间的选择
第 5 章 运输层(续) 5.6 TCP 可靠传输的实现 以字节为单位的滑动窗口 超时重传时间的选择 选择确认 SACK 5.7 TCP的流量控制 利用滑动窗口实现流量控制 必须考虑传输效率 课件制作人:谢希仁
5
第 5 章 运输层(续) 5.8 TCP 的拥塞控制 5.8.1 拥塞控制的一般原理 5.8.2 几种拥塞控制方法
第 5 章 运输层(续) 5.8 TCP 的拥塞控制 拥塞控制的一般原理 几种拥塞控制方法 随机早期检测 RED 5.9 TCP 的运输连接管理 TCP 的连接建立 TCP 的连接释放 TCP 的有限状态机 课件制作人:谢希仁
6
5.1 运输层协议概述 5.1.1 进程之间的通信 运输层的两个主要协议 运输层的端口
7
进程之间的通信
8
既然IP协议能够把源主机发送出的分组按照首部 中的目的地址送交到目的主机,那么,为什么还需要 再设置一个运输层呢?
进程之间的通信 (1)为什么需要运输层? 问题: 既然IP协议能够把源主机发送出的分组按照首部 中的目的地址送交到目的主机,那么,为什么还需要 再设置一个运输层呢?
9
进程之间的通信 解释: 两个主机进行通信实际上就是两个主机中的应用 进程互相通信。 IP协议虽然能把分组送到目的主机,但是这个分 组还停留在主机的网络层而没有交付给主机中的应用 进程。 运输层提供应用进程间的逻辑通信
10
进程之间的通信 从通信和信息处理的角度看,运输层向它上面的应用 层提供通信服务,它属于面向通信部分的最高层,同 时也是用户功能中的最低层。 当网络的边缘部分中的两个主机使用网络的核心部分 的功能进行端到端的通信时,只有位于网络边缘部分 的主机的协议栈才有运输层,而网络核心部分中的路 由器在转发分组时都只用到下三层的功能。
11
运输层为相互通信的应用进程提供了逻辑通信
AP1 AP4 5 4 3 2 1 AP2 AP3 5 4 3 2 1 端口 端口 运输层提供应用进程间的逻辑通信 IP 层 主机 A 主机 B 路由器 1 路由器 2 AP1 AP3 LAN1 WAN LAN2 AP2 AP4 IP 协议的作用范围 运输层协议 TCP 和 UDP 的作用范围
12
进程之间的通信 两个主机进行通信实际上就是两个主机中的应用进程 互相通信。 应用进程之间的通信又称为端到端的通信。 运输层的一个很重要的功能就是复用和分用。应用层 不同进程的报文通过不同的端口向下交到运输层,再 往下就共用网络层提供的服务。 “运输层提供应用进程间的逻辑通信”。“逻辑通信” 的意思是:运输层之间的通信好像是沿水平方向传送 数据。但事实上这两个运输层之间并没有一条水平方 向的物理连接。
13
因 特 网 5.1.1 进程之间的通信 应用进程 应用进程 (2)运输层协议和网络层协议的主要区别 … …
进程之间的通信 (2)运输层协议和网络层协议的主要区别 应用进程 应用进程 … … 因 特 网 IP 协议的作用范围 (提供主机之间的逻辑通信) TCP 和 UDP 协议的作用范围 (提供进程之间的逻辑通信)
14
运输层为应用进程之间提供端到端的逻辑通信(但网络层是为主机之间提供逻辑通信)。 运输层还要对收到的报文进行差错检测。
进程之间的通信 (3)运输层的主要功能 运输层为应用进程之间提供端到端的逻辑通信(但网络层是为主机之间提供逻辑通信)。 运输层还要对收到的报文进行差错检测。 根据应用程序的不同需求,运输层需要有两种不同的运输协议,即面向连接的 TCP 和无连接的 UDP。
15
进程之间的通信 (4)可靠与不可靠 运输层向高层用户屏蔽了下面网络核心的细节(如网络拓扑、所采用的路由选择协议等),它使应用进程看见的就是好像在两个运输层实体之间有一条端到端的逻辑通信信道,但这条逻辑通信信道对上层的表现却因运输层使用的不同协议而有很大的差别。 当运输层采用面向连接的 TCP 协议时,尽管下面的网络是不可 靠的(只提供尽最大努力服务),但这种逻辑通信信道就相当于一 条全双工的可靠信道。 当运输层采用无连接的 UDP 协议时,这种逻辑通信信道是一条 不可靠信道。
16
5.1.2 运输层的两个主要协议
17
5.1.2 运输层的两个主要协议 TCP/IP 的运输层有两个不同的协议: 用户数据报协议 UDP (User Datagram Protocol) (2)传输控制协议 TCP (Transmission Control Protocol)
18
5.1.2 运输层的两个主要协议 运输层协议在TCP/IP 协议栈中的位置 应用层 运输层 UDP TCP IP 与各种网络接口
19
两个对等运输实体在通信时传送的数据单位叫作运输协议数据单元 TPDU (Transport Protocol Data Unit)。
5.1.2 运输层的两个主要协议 TCP 与 UDP的协议数据单元 两个对等运输实体在通信时传送的数据单位叫作运输协议数据单元 TPDU (Transport Protocol Data Unit)。 TCP 传送的数据单位是 TCP 报文段(segment) UDP 传送的数据单位是 UDP 报文或用户数据报。
20
5.1.2 运输层的两个主要协议 UDP的特点 UDP 在传送数据之前不需要先建立连接。对方的运输层在收到 UDP 报文后,不需要给出任何确认。虽然 UDP 不提供可靠交付,但在某些情况下 UDP 是一种最有效的工作方式。
21
5.1.2 运输层的两个主要协议 TCP 则提供面向连接的服务。
22
5.1.2 运输层的两个主要协议 使用UDP和TCP协议的应用层协议 应用 应用层协议 运输层协议 域名解析 简单文件传送 路由选择协议
DNS UDP 简单文件传送 TFTP 路由选择协议 RIP IP地址配置 DHCP 电子邮件 SMTP TCP 万维网 HTTP 文件传送 FTP
23
运输层的端口
24
运输层的端口 (1)统一的标示 应用层所有的应用进程都可以通过运输层再传送到IP层,这就是复用。运输层从IP层收到数据后必须交付给指明的应用进程,这就是分用。显然,给应用层的每个应用进程赋予一个非常明确的标志是至关重要的。
25
运行在计算机中的进程是用进程标识符来标志的。
运输层的端口 (1)统一的标示 运行在计算机中的进程是用进程标识符来标志的。 运行在应用层的各种应用进程却不应当让计算机操作系统指派它的进程标识符。这是因为在因特网上使用的计算机的操作系统种类很多,而不同的操作系统又使用不同格式的进程标识符。 为了使运行不同操作系统的计算机的应用进程能够互相通信,就必须用统一的方法对 TCP/IP 体系的应用进程进行标志。
26
把信息传给一个岗位,而不能给一个具体的人
运输层的端口 (1)统一的标示 但是,把一个特定机器上运行的特定进程指明为因特网上 通信的最后终点还是不可行。 由于进程的创建和撤销都是动态的,发送方几乎无法识别其他机器上的进程。 有时我们会改换接收报文的进程,但并不需要通知所有发送方。 我们往往需要利用目的主机提供的功能来识别终点,而不需要知道实现这个功能的进程。 把信息传给一个岗位,而不能给一个具体的人
27
解决这个问题的方法就是在运输层使用协议端口号 (protocol port number),或通常简称为端口(port)。
运输层的端口 (2)运输层的协议端口号 解决这个问题的方法就是在运输层使用协议端口号 (protocol port number),或通常简称为端口(port)。 虽然通信的终点是应用进程,但我们可以把端口想象 是通信的终点,因为我们只要把要传送的报文交到目的 主机的某一个合适的目的端口,剩下的工作(即最后交 付目的进程)就由 TCP 来完成。
28
在协议栈层间的抽象的协议端口是软件端口。 路由器或交换机上的端口是硬件端口。
运输层的端口 (3)软件端口与硬件端口 在协议栈层间的抽象的协议端口是软件端口。 路由器或交换机上的端口是硬件端口。 硬件端口是不同硬件设备进行交互的接口,而软件端口是应用层的各种协议进程与运输实体进行层间交互的一种地址。
29
TCP/IP的运输层用一个 16 位端口号来标志一个端口。
运输层的端口 (4)端口号的分类 TCP/IP的运输层用一个 16 位端口号来标志一个端口。 两个计算机中的进程要互相通信,不仅必须知道对方的 IP地址(为了找到对方的计算机),而且还要知道对方 的端口号(为了找到对方计算机中的应用程序)。 IANA 就是指(Internet Assigned Numbers Authority) ,Internet号分配机构。负责对IP地址分 配规划以及对TCP/UDP公共服务的端口定义。
30
熟知端口号(0—1023):IANA把这些端口号指派给了 TCP/IP最重要的一些应用程序,让所有的用户都知道, 而且是固定的。
运输层的端口 (4)端口号的分类 服务器端使用的端口号 熟知端口号(0—1023):IANA把这些端口号指派给了 TCP/IP最重要的一些应用程序,让所有的用户都知道, 而且是固定的。 登记端口号(1024—49151):为没有熟知端口号的应用 程序使用,使用前必须在IANA登记,防止重复。
31
5.1.3 运输层的端口 一些常用的端口号 (4)端口号的分类 应用程序 端口号 FTP TELNET SMTP DNS TFTP HTTP
运输层的端口 (4)端口号的分类 一些常用的端口号 应用程序 FTP TELNET SMTP DNS TFTP HTTP QQ 端口号 21 23 25 53 69 80 4000
32
运输层的端口 (4)端口号的分类 客户端使用的端口号 客户端口号或短暂端口号,数值为49152~65535,留给客 户进程选择暂时使用。当服务器进程收到客户进程的报 文时,就知道了客户进程所使用的动态端口号。通信结 束后,这个端口号可供其他客户进程以后使用。
33
5.2 用户数据报协议 UDP UDP 概述 UDP 的首部格式
34
UDP 概述
35
UDP 只在 IP 的数据报服务之上增加了很少一点的功 能,即端口的功能和差错检测的功能。
虽然 UDP 用户数据报只能提供不可靠的交付,但 UDP 在某些方面有其特殊的优点。
36
UDP 是无连接的,即发送数据之前不需要建立连接。 UDP 使用尽最大努力交付,即不保证可靠交付,同时 也不使用拥塞控制。
37
应用层交给 UDP 多长的报文,UDP 就照样发送,即 一次发送一个报文。
发送方 UDP 对应用程序交下来的报文,在添加首部 后就向下交付 IP 层。UDP 对应用层交下来的报文, 既不合并,也不拆分,而是保留这些报文的边界。 应用层交给 UDP 多长的报文,UDP 就照样发送,即 一次发送一个报文。 接收方 UDP 对 IP 层交上来的 UDP 用户数据报,在 去除首部后就原封不动地交付上层的应用进程,一次 交付一个完整的报文。 应用程序必须选择合适大小的报文。
38
5.2.1 UDP 概述 (2)面向报文的 UDP 应用层报文 应用层 UDP 首部 UDP 用户数据报的数据部分 运输层 IP 首部
39
UDP 的首部格式
40
UDP 的首部格式 (1)UDP 基于端口的分用 IP 层 UDP 数据报到达 端口 2 端口 3 端口 1 UDP 分用
41
5.2.2 UDP 的首部格式 (2)UDP报文的格式 字节 4 4 1 1 2 源 IP 地址 目的 IP 地址 17 UDP长度 字节
17 UDP长度 字节 12 2 2 2 2 伪首部 源端口 目的端口 长 度 检验和 UDP 用户数据报 首 部 数 据 发送在前 首 部 数 据 IP 数据报
42
用户数据报 UDP 有两个字段:数据字段和首部字段。首部字段有 8 个字节,由 4 个字段组成,每个字段都是两个字节。
1 1 2 源 IP 地址 目的 IP 地址 17 UDP长度 字节 12 2 2 2 2 伪首部 源端口 目的端口 长 度 检验和 UDP 用户数据报 首 部 数 据 发送在前 首 部 数 据 IP 数据报
43
在计算检验和时,临时把“伪首部”和 UDP 用户数据报连接在一起。伪首部仅仅是为了计算检验和。
字节 4 4 1 1 2 源 IP 地址 目的 IP 地址 17 UDP长度 字节 12 2 2 2 2 伪首部 源端口 目的端口 长 度 检验和 UDP 用户数据报 首 部 数 据 发送在前 首 部 数 据 IP 数据报
44
计算 UDP 检验和的例子 → → → → → 0 和 17 → 15 → 1087 → 13 → 0(检验和) → 数据 → 数据 → 数据 → 数据和 0(填充) → 求和得出的结果 → 检验和 12 字节 伪首部 全 全 0 数据 数据 数据 数据 数据 数据 数据 全 0 8 字节 UDP 首部 7 字节 数据 填充 按二进制反码运算求和 将得出的结果求反码
45
5.3 传输控制协议 TCP 概述 TCP 最主要的特点 TCP 的连接
46
TCP 最主要的特点
47
TCP 最主要的特点 TCP 是面向连接的运输层协议。 每一条 TCP 连接只能有两个端点(endpoint),每一条 TCP 连接只能是点对点的(一对一)。 TCP 提供可靠交付的服务。 TCP 提供全双工通信。 面向字节流。
48
TCP 面向流的概念 接收方 发送方 应用进程 应用进程 H 表示 TCP 报文段的首部 x 表示序号为 x 的数据字节 字节流 1
2 3 字节流 19 20 21 从接收缓存 读取字节 把字节写入 发送缓存 TCP 加上 TCP 首部 构成 TCP 报文段 TCP 18 17 16 15 14 4 5 发送 TCP 报文段 13 12 11 H 10 9 H 7 6 8 H TCP 连接
49
TCP 的连接 TCP 把连接作为最基本的抽象。 每一条 TCP 连接有两个端点。 TCP 连接的端点不是主机,不是主机的IP 地址,不是 应用进程,也不是运输层的协议端口。TCP 连接的端 点叫做套接字(socket)或插口。 端口号拼接到(contatenated with) IP 地址即构成了 套接字。
50
套接字 socket = (IP地址: 端口号) (5-1)
每一条 TCP 连接唯一地被通信两端的两个端点(即两个套接字)所确定。即: TCP 连接 ::= {socket1, socket2} = {(IP1: port1), (IP2: port2)} (5-2)
51
5.4 可靠传输的工作原理 停止等待协议 连续 ARQ 协议
52
停止等待协议
53
A B A B (b) 超时重传 5.4.1 停止等待协议 (a) 无差错情况 (1)无差错和报文出现差错的情况 发送 M1 发送 M1
停止等待协议 (1)无差错和报文出现差错的情况 A B A B 发送 M1 发送 M1 丢弃有差错 的报文 确认 M1 发送 M2 超时重传 M1 确认 M2 确认 M1 发送 M3 发送 M2 确认 M3 t t t t (a) 无差错情况 (b) 超时重传
54
在发送完一个分组后,必须暂时保留已发送的分组的 副本。 分组和确认分组都必须进行编号。
停止等待协议 (1)无差错和报文出现差错的情况 在发送完一个分组后,必须暂时保留已发送的分组的 副本。 分组和确认分组都必须进行编号。 超时计时器的重传时间应当比数据在分组传输的平均 往返时间更长一些。
55
A B A B 5.4.1 停止等待协议 (a) 确认丢失 (b) 确认迟到 (2)确认丢失和确认迟到 发送 M1 发送 M1
停止等待协议 (2)确认丢失和确认迟到 A B A B 发送 M1 发送 M1 确认 M1 确认 M1 超时 重传 M1 超时 重传 M1 丢弃 重复的 M1 重传确认 M1 丢弃 重复的 M1 重传确认M1 发送 M2 发送 M2 收下迟到 的确认 但什么也不做 t t t t (a) 确认丢失 (b) 确认迟到
56
使用上述的确认和重传机制,我们就可以在不可靠的传 输网络上实现可靠的通信。
停止等待协议 (3)可靠通信的实现 使用上述的确认和重传机制,我们就可以在不可靠的传 输网络上实现可靠的通信。 这种可靠传输协议常称为自动重传请求ARQ (Automatic Repeat reQuest)。 ARQ 表明重传的请求是自动进行的。接收方不需要请求 发送方重传某个出错的分组 。
57
B A 5.4.1 停止等待协议 停止等待协议的优点是简单,但缺点是信道利用率太低。 t 确认 确认 分组 分组 t TD RTT
停止等待协议 (4)信道利用率 停止等待协议的优点是简单,但缺点是信道利用率太低。 B t 确认 确认 分组 分组 A t TD RTT TD + RTT + TA
58
停止等待协议 (4)信道利用率 U: 信道利用率 TD: 发送分组需要的时间 TA: 发送确认的时间 RTT:往返时间
59
提高信道利用率的改进措施 采用“流水线传输”方式。
60
流水线传输的含义 发送方可连续发送多个分组,不必每发完一个分组就停顿下来等待对方的确认。 由于信道上一直有数据不间断地传送,这种传输方式可获得很高的信道利用率。 B t ACK 分组 A t
61
流水线传输的含义 当使用流水线传输时,就要使用下面介绍的: 连续ARQ协议 滑动窗口协议
62
连续 ARQ 协议
63
连续 ARQ 协议 (1)发送窗口的概念 发送方维持着一个发送窗口,它的意义是:位于发送窗口内的分组都可以连续发送出去,而不需要等待对方的确认。这样,信道利用率就提高了。 发送方每收到一个确认,就把发送窗口向前滑动一个分组的位置。 【见下图所示】
64
连续 ARQ 协议 (1)发送窗口的概念 发送窗口 1 2 3 4 5 6 7 8 9 10 11 12 (a) 发送方维持发送窗口(发送窗口是 5) (b) 收到一个确认后发送窗口向前滑动 向前 1 2 3 4 5 6 7 8 9 10 11 12 发送窗口
65
连续 ARQ 协议 (2)累积确认 接收方一般采用累积确认的方式。即不必对收到的分组逐个发送确认,而是对按序到达的最后一个分组发送确认,这样就表示:到这个分组为止的所有分组都已正确收到了。
66
这就叫做 Go-back-N(回退 N),表示需要再退回来 重传已发送过的 N 个分组。
连续 ARQ 协议 (3)GO-back-N (回退N的概念) 如果发送方发送了前 5 个分组,而中间的第 3 个分 组丢失了。这时接收方只能对前两个分组发出确认。 发送方无法知道后面三个分组的下落,而只好把后面 的三个分组都再重传一次。 这就叫做 Go-back-N(回退 N),表示需要再退回来 重传已发送过的 N 个分组。 可见当通信线路质量不好时,连续 ARQ 协议会带来负 面的影响。
67
连续 ARQ 协议 前面只是给出了连续ARQ协议最基本的概念,在深入讨 论TCP的可靠传输问题之前,先了解一下TCP的报文段首部 的格式。
68
5.5 TCP 报文段的首部格式
69
32 位 TCP 报文段 发送在前 IP 首部 IP 数据部分 位 0 8 16 24 31 源 端 口 目 的 端 口 序 号
位 源 端 口 目 的 端 口 序 号 20 字节的 固定首部 TCP 首部 确 认 号 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 TCP 报文段 TCP 首部 TCP 数据部分 发送在前 IP 首部 IP 数据部分
70
源端口和目的端口字段——各占 2 字节。端口是运输层与应用层的服务接口。运输层的复用和分用功能都要通过端口才能实现。
位 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 TCP 首部 确 认 号 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 源端口和目的端口字段——各占 2 字节。端口是运输层与应用层的服务接口。运输层的复用和分用功能都要通过端口才能实现。
71
位 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 确 认 号 TCP 首部 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 序号字段——占 4 字节。TCP 连接中传送的数据流中的每一个字节都编上一个序号。序号字段的值则指的是本报文段所发送的数据的第一个字节的序号。
72
确认号字段——占 4 字节,是期望收到对方的下一个报文段的数据的第一个字节的序号。
位 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 确 认 号 TCP 首部 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 确认号字段——占 4 字节,是期望收到对方的下一个报文段的数据的第一个字节的序号。
73
位 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 确 认 号 TCP 首部 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 数据偏移(即首部长度)——占 4 位,它指出 TCP 报文段的数据起始处距离 TCP 报文段的起始处有多远。“数据偏移”的单位是 32 位字(以 4 字节为计算单位)。
74
保留字段——占 6 位,保留为今后使用,但目前应置为 0。
位 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 确 认 号 TCP 首部 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 保留字段——占 6 位,保留为今后使用,但目前应置为 0。
75
紧急 URG —— 当 URG 1 时,表明紧急指针字段有效。它告诉系统此报文段中有紧急数据,应尽快传送(相当于高优先级的数据)。
位 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 确 认 号 TCP 首部 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 紧急 URG —— 当 URG 1 时,表明紧急指针字段有效。它告诉系统此报文段中有紧急数据,应尽快传送(相当于高优先级的数据)。
76
确认 ACK —— 只有当 ACK 1 时确认号字段才有效。当 ACK 0 时,确认号无效。
位 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 确 认 号 TCP 首部 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 确认 ACK —— 只有当 ACK 1 时确认号字段才有效。当 ACK 0 时,确认号无效。
77
位 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 确 认 号 TCP 首部 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 推送 PSH (PuSH) —— 接收 TCP 收到 PSH = 1 的报文段,就尽快地交付接收应用进程,而不再等到整个缓存都填满了后再向上交付。
78
位 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 TCP 首部 确 认 号 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 复位 RST (ReSeT) —— 当 RST 1 时,表明 TCP 连接中出现严重差错(如由于主机崩溃或其他原因),必须释放连接,然后再重新建立运输连接。
79
同步 SYN —— 同步 SYN = 1 表示这是一个连接请求或连接接受报文。
位 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 确 认 号 TCP 首部 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 同步 SYN —— 同步 SYN = 1 表示这是一个连接请求或连接接受报文。
80
终止 FIN (FINis) —— 用来释放一个连接。FIN 1 表明此报文段的发送端的数据已发送完毕,并要求释放运输连接。
位 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 确 认 号 TCP 首部 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 终止 FIN (FINis) —— 用来释放一个连接。FIN 1 表明此报文段的发送端的数据已发送完毕,并要求释放运输连接。
81
窗口字段 —— 占 2 字节,用来让对方设置发送窗口的依据,单位为字节。
位 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 确 认 号 TCP 首部 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 窗口字段 —— 占 2 字节,用来让对方设置发送窗口的依据,单位为字节。
82
检验和 —— 占 2 字节。检验和字段检验的范围包括首部和数据这两部分。在计算检验和时,要在 TCP 报文段的前面加上 12 字节的伪首部。
位 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 TCP 首部 确 认 号 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 检验和 —— 占 2 字节。检验和字段检验的范围包括首部和数据这两部分。在计算检验和时,要在 TCP 报文段的前面加上 12 字节的伪首部。
83
紧急指针字段 —— 占 16 位,指出在本报文段中紧急数据共有多少个字节(紧急数据放在本报文段数据的最前面)。
位 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 确 认 号 TCP 首部 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 紧急指针字段 —— 占 16 位,指出在本报文段中紧急数据共有多少个字节(紧急数据放在本报文段数据的最前面)。
84
MSS (Maximum Segment Size)
比特 MSS (Maximum Segment Size) 是 TCP 报文段中的数据字段的最大长度。 数据字段加上 TCP 首部 才等于整个的 TCP 报文段。 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 TCP 首部 确 认 号 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 选项字段 —— 长度可变。TCP 最初只规定了一种选项,即最大报文段长度 MSS。MSS 告诉对方 TCP:“我的缓存所能接收的报文段的数据字段的最大长度是 MSS 个字节。”
85
其他选项 窗口扩大选项 ——占 3 字节,其中有一个字节表示移位值 S。新的窗口值等于TCP 首部中的窗口位数增大到(16 + S),相当于把窗口值向左移动 S 位后获得实际的窗口大小。 时间戳选项——占10 字节,其中最主要的字段时间戳值字段(4 字节)和时间戳回送回答字段(4 字节)。 选择确认选项——在后面的 节介绍。
86
填充字段 —— 这是为了使整个首部长度是 4 字节的整数倍。
位 源 端 口 目 的 端 口 序 号 20 字节 固定 首部 确 认 号 TCP 首部 数据 偏移 U R G A C K P S H R S T S Y N F I N 保 留 窗 口 检 验 和 紧 急 指 针 选 项 (长 度 可 变) 填 充 填充字段 —— 这是为了使整个首部长度是 4 字节的整数倍。
87
5.6 TCP 可靠传输的实现 以字节为单位的滑动窗口 超时重传时间的选择 选择确认 SACK
88
TCP可靠传输的关键点在于:一定要收到确认,否则就重 传。
连续ARQ协议采用“流水线传输”,提高信道利用率,并 且其采用“累积确认”; 通过滑动窗口协议,可以实现累积确认,这时要用到TCP 报文首部中的“确认号”字段。
89
以字节为单位的滑动窗口
90
TCP 标准强烈不赞成 发送窗口前沿向后收缩
5.6.1 以字节为单位的滑动窗口 根据 B 给出的窗口值 A 构造出自己的发送窗口 后沿 前沿 前移 收缩 前移 A 的发送窗口 = 20 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 不允许发送 已发送并 收到确认 允许发送的序号 B 期望 收到的序号 TCP 标准强烈不赞成 发送窗口前沿向后收缩
91
P3 – P2 = 允许发送但尚未发送的字节数(又称为可用窗口)
A 发送了 11 个字节的数据 A 的发送窗口位置不变 可用窗口 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 已发送并 收到确认 不允许发送 已发送但未收到确认 允许发送但尚未发送 P1 P2 P3 B 的接收窗口 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 已发送确认 并交付主机 不允许接收 允许接收 B收到了序号为32、33的数据(没收到31),未按序收到,因此B发送的确认报文中的确认号仍然是31. P3 – P1 = A 的发送窗口(又称为通知窗口) P2 – P1 = 已发送但尚未收到确认的字节数 P3 – P2 = 允许发送但尚未发送的字节数(又称为可用窗口)
92
接下来…… 现在假定B收到了序号为31的数据,并把序号为31—33 的数据交付给主机,然后B删除这些数据。
接着把接收窗口向前移动3个序号,同时给A发送确认, 其中窗口值仍是20,但确认号是34,表明B已经收到了 到序号33为止的数据。 A收到B的确认后,把发送窗口向前滑动3个序号,现在A 的可用窗口增大。
93
A 收到新的确认号,发送窗口向前滑动 A 的发送窗口向前滑动 已发送并收到确认 不允许 发送 已发送 但未收到确认 允许发送但尚未发送 P1
26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 已发送并收到确认 不允许 发送 已发送 但未收到确认 允许发送但尚未发送 P1 P2 P3 B 的接收窗口向前滑动 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 已发送确认 并交付主机 不允许 接收 允许接收 未按序收到 先存下,等待缺少的 数据的到达
94
接下来…… A继续发送完序号42—53的数据后,指针P2与P3重合, 发送窗口内的序号都已用完,但还没有再收到确认。
95
A 的发送窗口内的序号都已用完, 但还没有再收到确认,必须停止发送。 A 的发送窗口已满,有效窗口为零 已发送并收到确认 不允许 发送
26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 已发送并收到确认 不允许 发送 已发送但未收到确认 P1 P2 P3
96
发送缓存 发送应用程序 TCP 发送缓存 发送窗口 已发送 最后被确认 的字节 最后发送 的字节 序号增大
97
接收缓存 接收应用程序 TCP 接收缓存 下一个读取 的字节 接收窗口 已收到 序号增大 下一个期望收到的 字节(确认号)
98
发送缓存用来暂时存放: 接收缓存用来暂时存放: 发送缓存与接收缓存的作用 发送应用程序传送给发送方 TCP 准备发送的数据;
按序到达的、但尚未被接收应用程序读取的数据; 不按序到达的数据。
99
需要强调三点 A 的发送窗口并不总是和 B 的接收窗口一样大(因为 有一定的时间滞后)。
TCP 标准没有规定对不按序到达的数据应如何处理。 通常是先临时存放在接收窗口中,等到字节流中所缺 少的字节收到后,再按序交付上层的应用进程。 TCP 要求接收方必须有累积确认的功能,这样可以减 小传输开销。
100
超时重传时间的选择
101
超时重传时间的选择 重传机制是 TCP 中最重要和最复杂的问题之一。 TCP 每发送一个报文段,就对这个报文段设置一次计 时器。只要计时器设置的重传时间到但还没有收到确 认,就要重传这一报文段。
102
往返时延的方差很大 由于 TCP 的下层是一个互联网环境,IP 数据报所选择的路由变化很大。因而运输层的往返时间的方差也很大。 往返时间的
概率分布 数据链路层 运输层 时间 T1 T2 T3
103
新的 RTTS (1 ) (旧的 RTTS)
加权平均往返时间 TCP 保留了 RTT 的一个加权平均往返时间 RTTS(这又称为平滑的往返时间)。 第一次测量到 RTT 样本时,RTTS 值就取为所测量到的 RTT 样本值。以后每测量到一个新的 RTT 样本,就按下式重新计算一次 RTTS: 新的 RTTS (1 ) (旧的 RTTS) (新的 RTT 样本) 式中,0 1。若 很接近于零,表示 RTT 值更新较慢。若选择 接近于 1,则表示 RTT 值更新较快。 RFC 2988 推荐的 值为 1/8,即 0.125。 课件制作人:谢希仁
104
超时重传时间 RTO (RetransmissionTime-Out)
RTO 应略大于上面得出的加权平均往返时间 RTTS。 RFC 2988 建议使用下式计算 RTO: RTO RTTS + 4 RTTD (5-5) RTTD 是 RTT 的偏差的加权平均值。 RFC 2988 建议这样计算 RTTD。第一次测量时,RTTD 值取为测量到的 RTT 样本值的一半。在以后的测量中,则使用下式计算加权平均的 RTTD: 新的 RTTD = (1 ) (旧的RTTD) + RTTS 新的 RTT 样本 (5-6) 是个小于 1 的系数,其推荐值是 1/4,即 0.25。 课件制作人:谢希仁
105
往返时间的测量相当复杂 TCP 报文段 1 没有收到确认。重传(即报文段 2)后,收到了确认报文段 ACK。
如何判定此确认报文段是对原来的报文段 1 的确认,还是对重传的报文段 2 的确认? 是对哪一个报文段 的确认? 发送一个 TCP 报文段 超时重传 TCP 报文段 收到 ACK 1 2 时间 往返时间 RTT? 往返时间 RTT?
106
Karn 算法 在计算平均往返时间 RTT 时,只要报文段重传了,就不采用其往返时间样本。
这样得出的加权平均平均往返时间 RTTS 和超时重传时间 RTO 就较准确。
107
修正的 Karn 算法 报文段每重传一次,就把 RTO 增大一些: 新的 RTO (旧的 RTO) 系数 的典型值是 2 。
当不再发生报文段的重传时,才根据报文段的往返时延更新平均往返时延 RTT 和超时重传时间 RTO 的数值。 实践证明,这种策略较为合理。
108
5.6.3 选择确认 SACK (Selective ACK)
接收方收到了和前面的字节流不连续的两个字节块。 如果这些字节的序号都在接收窗口之内,那么接收方就先收下这些数据,但要把这些信息准确地告诉发送方,使发送方不要再重复发送这些已收到的数据。
109
… … 接收到的字节流序号不连续 … … … 和前后字节不连续的每一个字节块都有两个边界: 左边界和右边界。图中用四个指针标记这些边界。
连续的字节流 第一个字节块 … 第二个字节块 … … … … 确认号 = 1001 L1 = 1501 R1 = 3001 L2 = 3501 R1 = 4501 和前后字节不连续的每一个字节块都有两个边界: 左边界和右边界。图中用四个指针标记这些边界。 第一个字节块的左边界 L1 = 1501,但右边界 R1 = 3001。 左边界指出字节块的第一个字节的序号,但右边界减 1 才是 字节块中的最后一个序号。 第二个字节块的左边界 L2 = 3501,而右边界 R2 = 4501。
110
RFC 2018 的规定 如果要使用选择确认,那么在建立 TCP 连接时,就要在 TCP 首部的选项中加上“允许 SACK”的选项,而双方必须都事先商定好。 如果使用选择确认,那么原来首部中的“确认号字段”的用法仍然不变。只是以后在 TCP 报文段的首部中都增加了 SACK 选项,以便报告收到的不连续的字节块的边界。 由于首部选项的长度最多只有 40 字节,而指明一个边界就要用掉 4 字节,因此在选项中最多只能指明 4 个字节块的边界信息。
111
5.7 TCP 的流量控制
112
5.7 TCP 的流量控制 一般说来,我们总是希望数据传输得更快一些。但如果发送方把数据发送得过快,接收方就可能来不及接收,这就会造成数据的丢失。 流量控制(flow control)就是让发送方的发送速率不要太快,既要让接收方来得及接收,也不要使网络发生拥塞。 利用滑动窗口机制可以很方便地在 TCP 连接上实现流量控制。
113
利用滑动窗口实现流量控制
114
再设每一个报文段为100字节长,数据报文段序号初始值为1,用seq=1表示。 ACK表示报文首部的确认位ACK,ack表示确认号的值
5.7.1利用滑动窗口实现流量控制 (1)流控举例说明 假设A向B发送数据。在连接建立时,B告诉了A:“我的接收窗口rwnd=400”。因此,发送方的发送窗口不能超过接收方给出的接收窗口的数值。要注意:窗口单位是字节。 再设每一个报文段为100字节长,数据报文段序号初始值为1,用seq=1表示。 ACK表示报文首部的确认位ACK,ack表示确认号的值 【过程见下页】
115
A 向 B 发送数据。在连接建立时, B 告诉 A:“我的接收窗口 rwnd = 400(字节)”。
seq = 1, DATA A 发送了序号 1 至 100,还能发送 300 字节 seq = 101, DATA A 发送了序号 101 至 200,还能发送 200 字节 seq = 201, DATA 丢失! ACK = 1, ack = 201, rwnd = 300 允许 A 发送序号 201 至 500 共 300 字节 seq = 301, DATA A 发送了序号 301 至 400,还能再发送 100 字节新数据 seq = 401, DATA A 发送了序号 401 至 500,不能再发送新数据了 seq = 201, DATA A 超时重传旧的数据,但不能发送新的数据 ACK = 1, ack = 501, rwnd = 100 允许 A 发送序号 501 至 600 共 100 字节 seq = 501, DATA A 发送了序号 501 至 600,不能再发送了 ACK = 1, ack = 601, rwnd = 0 不允许 A 再发送(到序号 600 为止的数据都收到了)
116
可以看到,接收方的主机B进行了三次流量控制。第1次把窗口减小到300,第2次减到100,最后减到0,即不允许发送方再发送数据了。
5.7.1利用滑动窗口实现流量控制 (1)流控举例说明 可以看到,接收方的主机B进行了三次流量控制。第1次把窗口减小到300,第2次减到100,最后减到0,即不允许发送方再发送数据了。 这种使发送方暂停发送的状态将持续到主机B重新发出一个新的窗口值为止。 注意,B向A发送的三个报文段都设置了ACK=1,表明此时首部的确认号有意义
117
B向A发送了零窗口报文,A停止发送报文; B的接收窗口又有了存储空间,向A发送了rwnd=400的报文段。 但是该报文在发送过程中丢了;
5.7.1利用滑动窗口实现流量控制 (2)死锁的出现与解决 B向A发送了零窗口报文,A停止发送报文; B的接收窗口又有了存储空间,向A发送了rwnd=400的报文段。 但是该报文在发送过程中丢了; 此时,B只能等待A发,但A又不能发。 死锁!
118
只要 TCP 连接的一方收到对方的零窗口通知,就启动持续计时器。
5.7.1利用滑动窗口实现流量控制 (2)死锁的出现与解决 TCP 为每一个连接设有一个持续计时器。 只要 TCP 连接的一方收到对方的零窗口通知,就启动持续计时器。 若持续计时器设置的时间到期,就发送一个零窗口探测报文段(仅携带 1 字节的数据),而对方就在确认这个探测报文段时给出了现在的窗口值。 若窗口仍然是零,则收到这个报文段的一方就重新设置持续计时器。 若窗口不是零,则死锁的僵局就可以打破了。
119
5.7.2 必须考虑传输效率 可以用不同的机制来控制 TCP 报文段的发送时机:
必须考虑传输效率 可以用不同的机制来控制 TCP 报文段的发送时机: 第一种机制是 TCP 维持一个变量,它等于最大报文段 长度 MSS。只要缓存中存放的数据达到 MSS 字节时, 就组装成一个 TCP 报文段发送出去。 第二种机制是由发送方的应用进程指明要求发送报文 段,即 TCP 支持的推送(push)操作。 第三种机制是发送方的一个计时器期限到了,这时就 把当前已有的缓存数据装入报文段(但长度不能超过 MSS)发送出去。
120
5.8 TCP的拥塞控制
121
拥塞控制的一般原理
122
在某段时间,若对网络中某资源的需求超过了该资源所能提供的可用部分,网络的性能就要变坏——产生拥塞(congestion)。
拥塞控制的一般原理 (1)什么是拥塞? 在某段时间,若对网络中某资源的需求超过了该资源所能提供的可用部分,网络的性能就要变坏——产生拥塞(congestion)。 出现资源拥塞的条件: 对资源需求的总和 > 可用资源 若网络中有许多资源同时产生拥塞,网络的性能就要明显变坏,整个网络的吞吐量将随输入负荷的增大而下降。
123
拥塞控制所要做的都有一个前提,就是网络能够承受现有的网络负荷。
拥塞控制的一般原理 (2)拥塞控制与流量控制的关系 拥塞控制所要做的都有一个前提,就是网络能够承受现有的网络负荷。 拥塞控制是一个全局性的过程,涉及到所有的主机、所有的路由器,以及与降低网络传输性能有关的所有因素。 流量控制往往指在给定的发送端和接收端之间的点对点通信量的控制。 流量控制所要做的就是抑制发送端发送数据的速率,以便使接收端来得及接收。
124
整网带宽大,不会拥塞,而两端点之间的发送和接收不对等,需要流控。 两端点之间不需要流控,而整网有可能发送拥塞。
拥塞控制的一般原理 拥塞和流控有区别,例如: 整网带宽大,不会拥塞,而两端点之间的发送和接收不对等,需要流控。 两端点之间不需要流控,而整网有可能发送拥塞。
125
5.8.1 拥塞控制的一般原理 (3)拥塞控制所起到的作用 吞吐量 理想的拥塞控制 实际的拥塞控制 无拥塞控制 死锁(吞吐量 = 0)
拥塞控制的一般原理 (3)拥塞控制所起到的作用 吞吐量 理想的拥塞控制 实际的拥塞控制 无拥塞控制 拥塞 轻度 死锁(吞吐量 = 0) 提供的负载
126
开环控制:就是在设计网络时事先将有关发生拥塞的因 素考虑周到,力求网络在工作时不产生拥塞。
拥塞控制的一般原理 (4)拥塞控制的一般原理 开环控制:就是在设计网络时事先将有关发生拥塞的因 素考虑周到,力求网络在工作时不产生拥塞。 闭环控制:是基于反馈环路的概念。属于闭环控制的有 以下几种措施: 监测网络系统以便检测到拥塞在何时、何处发生。 将拥塞发生的信息传送到可采取行动的地方。 调整网络系统的运行以解决出现的问题。
127
拥塞控制方法(1) 慢开始和拥塞避免
128
拥塞控制方法:慢开始和拥塞避免 (1)拥塞窗口的设置 发送方维持一个叫做拥塞窗口 cwnd (congestion window)的状态变量。拥塞窗口的大小取决于网络的拥塞 程度,并且动态地在变化。发送方让自己的发送窗口等 于拥塞窗口。如再考虑到接收方的接收能力,则发送窗 口还可能小于拥塞窗口。 发送方控制拥塞窗口的原则是:只要网络没有出现拥塞, 拥塞窗口就再增大一些,以便把更多的分组发送出去。 但只要网络出现拥塞,拥塞窗口就减小一些,以减少注 入到网络中的分组数。
129
在主机刚刚开始发送报文段时可先设置拥塞窗口 cwnd = 1,即设置为一个最大报文段 MSS 的数值。
拥塞控制方法:慢开始和拥塞避免 (2)慢开始算法的原理 在主机刚刚开始发送报文段时可先设置拥塞窗口 cwnd = 1,即设置为一个最大报文段 MSS 的数值。 在每收到一个对新的报文段的确认后,将拥塞窗口加 1,即增加一个 MSS 的数值。 用这样的方法逐步增大发送端的拥塞窗口 cwnd,可以使分组注入到网络的速率更加合理。 刚开始时,先探测一下,由小到大逐渐增大发送窗口。
130
为方便起见,用报文段的个数作为窗口大小的单位,(请注意:实际上TCP是用字节作为窗口的单位),这样可以使用较小的数字来说明拥塞控制的原理
拥塞控制方法:慢开始和拥塞避免 (2)慢开始算法的原理 下面举例说明慢开始算法的过程 为方便起见,用报文段的个数作为窗口大小的单位,(请注意:实际上TCP是用字节作为窗口的单位),这样可以使用较小的数字来说明拥塞控制的原理
131
… 发送方每收到一个对新报文段的确认 (重传的不算在内)就使 cwnd 加 1。 t t 发送方 接收方 cwnd = 1 发送 M1
轮次 1 确认 M1 cwnd = 2 发送 M2~M3 确认 M2~M3 轮次 2 cwnd = 4 发送 M4~M7 确认 M4~M7 轮次 3 cwnd = 8 发送 M8~M15 … t t
132
使用慢开始算法后,每经过一个传输轮次,拥塞窗口 cwnd 就加倍。 一个传输轮次所经历的时间其实就是往返时间 RTT。
拥塞控制方法:慢开始和拥塞避免 (3)传输轮次(transmission round) 使用慢开始算法后,每经过一个传输轮次,拥塞窗口 cwnd 就加倍。 一个传输轮次所经历的时间其实就是往返时间 RTT。 “传输轮次”更加强调:把拥塞窗口 cwnd 所允许发送的报文段都连续发送出去,并收到了对已发送的最后一个字节的确认。 例如,拥塞窗口 cwnd = 4,这时的往返时间 RTT 就是发送方连续发送 4 个报文段,并收到这 4 个报文段的确认,总共经历的时间。
133
(4)设置慢开始门限状态变量ssthresh
拥塞控制方法:慢开始和拥塞避免 (4)设置慢开始门限状态变量ssthresh 注意: 慢开始的“慢”并不是指拥塞窗口的增长速率慢,实 际上它增长很快。而是指在TCP开始发送报文时先设置 拥塞窗口=1,使得发送方在开始时只发送一个报文段, 然后再逐渐增大拥塞窗口,这当然比按照大的拥塞窗 口一下子把许多报文突然注入到网络中要“慢得多”。 为了防止拥塞窗口增长过大引起网络拥塞,还需要设 置一个慢开始门限。
134
(4)设置慢开始门限状态变量ssthresh
拥塞控制方法:慢开始和拥塞避免 (4)设置慢开始门限状态变量ssthresh 慢开始门限 ssthresh 的用法如下: 当 cwnd < ssthresh 时,使用慢开始算法。 当 cwnd > ssthresh 时,停止使用慢开始算法而改用 拥塞避免算法。 当 cwnd = ssthresh 时,既可使用慢开始算法,也可 使用拥塞避免算法。
135
5.8.2 拥塞控制方法:慢开始和拥塞避免 (5)拥塞避免算法 前面提到:
拥塞控制方法:慢开始和拥塞避免 (5)拥塞避免算法 前面提到: 当 cwnd > ssthresh 时,停止使用慢开始算法而改用拥塞避免 算法。 当 cwnd = ssthresh 时,既可使用慢开始算法,也可使用拥塞 避免算法。 拥塞避免算法的思路是让拥塞窗口 cwnd 缓慢地增大,即每经过 一个往返时间 RTT 就把发送方的拥塞窗口 cwnd 加 1,而不是 加倍,使拥塞窗口 cwnd 按线性规律缓慢增长。 注意:拥塞避免算法只是尽量避免拥塞,并不能完全避免拥塞
136
然后把拥塞窗口 cwnd 重新设置为 1,执行慢开始算法。
拥塞控制方法:慢开始和拥塞避免 (6)当网络出现拥塞时的处理方法 无论在慢开始阶段还是在拥塞避免阶段,只要发送方判断 网络出现拥塞(其根据就是没有按时收到确认),就要把 慢开始门限 ssthresh 设置为出现拥塞时的发送方窗口值 的一半(但不能小于2)。 然后把拥塞窗口 cwnd 重新设置为 1,执行慢开始算法。 这样做的目的就是要迅速减少主机发送到网络中的分组数, 使得发生拥塞的路由器有足够时间把队列中积压的分组处 理完毕。
137
TCP连接进行初始化时,拥塞窗口cwnd置为1.慢开始门限 值ssthresh=16。
拥塞控制方法:慢开始和拥塞避免 (7)慢开始和拥塞避免算法的实现举例 假设: TCP连接进行初始化时,拥塞窗口cwnd置为1.慢开始门限 值ssthresh=16。 发送端的发送窗口不能超过拥塞窗口 cwnd 和接收端窗口 rwnd 中的最小值。我们假定接收端窗口足够大,因此现 在发送窗口的数值等于拥塞窗口的数值。 整个过程见下面的页面
138
执行慢开始算法,拥塞窗口 cwnd 的初始值为 1,发送第一个报文段 M0。
第1步:开始时(第0个轮次) 执行慢开始算法,拥塞窗口 cwnd 的初始值为 1,发送第一个报文段 M0。 拥塞窗口 cwnd 24 20 ssthresh 的初始值 16 12 8 4 传输轮次 2 4 6 8 10 12 20 22 慢开始
139
发送端每收到一个确认 ,就把 cwnd 加 1。于是发送端可以接着发送 M1 和 M2 两个报文段。
第2步:第1个轮次 发送端每收到一个确认 ,就把 cwnd 加 1。于是发送端可以接着发送 M1 和 M2 两个报文段。 拥塞窗口 cwnd 24 20 ssthresh 的初始值 16 新的 ssthresh 值 12 8 4 慢开始 传输轮次 2 4 6 8 10 12 20 22 慢开始
140
第3步:第2个轮次 接收端共发回两个确认。发送端每收到一个对新报文段的确认,就把发送端的 cwnd 加 1。现在 cwnd 从 2 增大到 4,并可接着发送后面的 4 个报文段。 拥塞窗口 cwnd 24 20 ssthresh 的初始值 16 新的 ssthresh 值 12 8 4 慢开始 传输轮次 2 4 6 8 10 12 20 22 慢开始
141
发送端每收到一个对新报文段的确认,就把发送端的拥塞窗口加 1,因此拥塞窗口 cwnd 随着传输轮次按指数规律增长。
第4步:第3个轮次 发送端每收到一个对新报文段的确认,就把发送端的拥塞窗口加 1,因此拥塞窗口 cwnd 随着传输轮次按指数规律增长。 拥塞窗口 cwnd 24 20 ssthresh 的初始值 16 新的 ssthresh 值 12 8 指数规律增长 4 慢开始 传输轮次 2 4 6 8 10 12 20 22 慢开始
142
第5步:当拥塞窗口=门限值时 当拥塞窗口 cwnd 增长到慢开始门限值 ssthresh 时(即当 cwnd = 16 时),改为执行拥塞避免算法,即每经过一个往返时间 RTT 就把发送方的拥塞窗口 cwnd 加 1,拥塞窗口按线性规律增长,即“加法增大” 拥塞避免 “加法增大” 拥塞窗口 cwnd 24 20 ssthresh 的 初始值 16 12 8 指数规律增长 4 慢开始 传输轮次 2 4 6 8 10 12 20 22 慢开始
143
假定拥塞窗口的数值增长到 24 时,网络出现超时,表明网络拥塞了。
第6步:当拥塞出现时 假定拥塞窗口的数值增长到 24 时,网络出现超时,表明网络拥塞了。 此时将 ssthresh 值变为 12(即此时发送窗口数值 24 的一半,“乘法减小”),拥塞窗口再重新设置为 1,并执行慢开始算法。 拥塞避免 “加法增大” 网络拥塞 拥塞窗口 cwnd 24 20 “乘法减小” ssthresh 初始值 16 新的 ssthresh 值 12 8 指数规律增长 4 慢开始 传输轮次 2 4 6 8 10 12 14 16 20 22 慢开始 慢开始
144
当 cwnd = 12 时改为执行拥塞避免算法,拥塞窗口按线性规律增长,每经过一个往返时延就增加一个 MSS 的大小。
“加法增大” 网络拥塞 拥塞窗口 cwnd 拥塞避免 “加法增大” 24 20 “乘法减小” ssthresh 初始值 16 新的 ssthresh 值 12 8 指数规律增长 4 慢开始 传输轮次 2 4 6 8 10 12 14 16 20 22 慢开始 慢开始
145
当网络频繁出现拥塞时,ssthresh 值就下降得很快, 以大大减少注入到网络中的分组数。
拥塞控制方法:慢开始和拥塞避免 (8)乘法减小 “乘法减小“是指不论在慢开始阶段还是拥塞避免阶段, 只要出现一次超时(即出现一次网络拥塞),就把慢开 始门限值 ssthresh 设置为当前的拥塞窗口值乘以 0.5。 当网络频繁出现拥塞时,ssthresh 值就下降得很快, 以大大减少注入到网络中的分组数。
146
拥塞控制方法:慢开始和拥塞避免 (9)加法增大 “加法增大”是指执行拥塞避免算法后,在收到对所有报文段的确认后(即经过一个往返时间),就把拥塞窗口 cwnd增加一个 MSS 大小,使拥塞窗口缓慢增大,以防止网络过早出现拥塞。
147
“拥塞避免”并非指完全能够避免了拥塞。利用以上 的措施要完全避免网络拥塞还是不可能的。
拥塞控制方法:慢开始和拥塞避免 (10)必须强调指出 “拥塞避免”并非指完全能够避免了拥塞。利用以上 的措施要完全避免网络拥塞还是不可能的。 “拥塞避免”是说在拥塞避免阶段把拥塞窗口控制为 按线性规律增长,使网络比较不容易出现拥塞。
148
拥塞控制方法(2) 快重传和快恢复
149
快重传算法首先要求接收方每收到一个失序的报文段后就立即发出重复确认。这样做可以让发送方及早知道有报文段没有到达接收方。
拥塞控制方法2:快重传和快恢复 (1)快重传的含义 快重传算法首先要求接收方每收到一个失序的报文段后就立即发出重复确认。这样做可以让发送方及早知道有报文段没有到达接收方。 发送方只要一连收到三个重复确认就应当立即重传对方尚未收到的报文段,不必等待重传计时器到期。 不难看出,快重传并非取消重传计时器,而是在某些情况下可更早地重传丢失的报文段。
150
t ? 立即重传 M3 t (2)快重传举例 发送方 接收方 发送 M1 发送 M2 确认 M1 发送 M3 确认 M2 丢失 发送 M4
收到三个连续的 对 M2 的重复确认 立即重传 M3 重复确认 M2 发送 M6 重复确认 M2 发送 M7 立即重传 M3 t t
151
当发送端收到连续三个重复的确认时,就执行“乘法减小”算法,把慢开始门限 ssthresh 减半。但接下去不执行慢开始算法。
拥塞控制方法2:快重传和快恢复 (3)快恢复算法 当发送端收到连续三个重复的确认时,就执行“乘法减小”算法,把慢开始门限 ssthresh 减半。但接下去不执行慢开始算法。 由于发送方现在认为网络很可能没有发生拥塞,因此现在不执行慢开始算法,即拥塞窗口 cwnd 现在不设置为 1,而是设置为慢开始门限 ssthresh 减半后的数值,然后开始执行拥塞避免算法(“加法增大”),使拥塞窗口缓慢地线性增大。
152
假设cwnd=24时,连续收到三个重复的确认,则执行快重传
(3)快重传与快恢复图例 假设cwnd=24时,连续收到三个重复的确认,则执行快重传 拥塞窗口 cwnd 收到 3 个重复的确认 执行快重传算法 24 拥塞避免 “加法增大” TCP Reno 版本 拥塞避免 “加法增大” 20 “乘法减小” ssthresh 的初始值 16 新的 ssthresh 值 12 TCP Tahoe 版本 (已废弃不用) 快恢复 8 4 慢开始 慢开始 传输轮次 2 4 6 8 10 12 14 16 18 20 22
153
发送窗口的上限值 Min [rwnd, cwnd]
当 cwnd < rwnd 时,则是网络的拥塞限制发送窗口的最大值。
154
TCP 的运输连接管理
155
TCP是面向连接的的协议。也就是说,传输TCP报文时, 要先建立连接,传输完成后,要释放连接。
【什么是运输连接管理 ?】 TCP是面向连接的的协议。也就是说,传输TCP报文时, 要先建立连接,传输完成后,要释放连接。 因此,运输连接就有三个阶段,即:连接建立、数据 传送和连接释放。 运输连接的管理就是使运输连接的建立和释放都能正 常地进行。
156
连接建立过程中要解决以下三个问题: 5-9 TCP 的运输连接管理 要使每一方能够确知对方的存在。
【建立运输连接的目的】 连接建立过程中要解决以下三个问题: 要使每一方能够确知对方的存在。 要允许双方协商一些参数(如最大报文段长度,最大窗口大小,服务质量等)。 能够对运输实体资源(如缓存大小,连接表中的项目等)进行分配。
157
TCP 连接的建立都是采用客户服务器方式。 主动发起连接建立的应用进程叫做客户(client)。
被动等待连接建立的应用进程叫做服务器(server)。
158
TCP 的连接建立 用三次握手建立 TCP 连接
159
用三次握手建立 TCP 连接 5.9.1 TCP 的连接建立 A 的 TCP 向 B 发出连接请求报文段,其首部中的
客户 服务器 A B 主动打开 被动打开 CLOSED CLOSED SYN = 1, seq = x A 的 TCP 向 B 发出连接请求报文段,其首部中的 同步位 SYN = 1,并选择序号 seq = x,表明传送 数据时的第一个数据字节的序号是 x。
160
用三次握手建立 TCP 连接 第1次握手 客户 服务器 SYN = 1, seq = x A发出连接请求。序号是 x
B 主动打开 被动打开 CLOSED CLOSED SYN = 1, seq = x 第1次握手 SYN = 1, ACK = 1, seq = y, ack= x 1 A发出连接请求。序号是 x B 的 TCP 收到连接请求报文段后,如同意,则发回确认。 B 在确认报文段中应使 SYN = 1,使 ACK = 1,其确认号ack = x 1,自己选择的序号 seq = y。
161
A 收到此报文段后向 B 给出确认,其 ACK = 1, 确认号 ack = y 1。 A 的 TCP 通知上层应用进程:连接已经建立。
客户 服务器 A B 主动打开 被动打开 CLOSED CLOSED SYN = 1, seq = x 第1次握手 SYN = 1, ACK = 1, seq = y, ack= x 1 第2次握手 ACK = 1, seq = x + 1, ack = y 1
162
B 的 TCP 收到主机 A 的确认后,也通知其上层 应用进程:TCP 连接已经建立。
客户 服务器 A B 主动打开 被动打开 CLOSED CLOSED SYN = 1, seq = x 第1次握手 SYN = 1, ACK = 1, seq = y, ack= x 1 第2次握手 ACK = 1, seq = x + 1, ack = y 1 第3次握手 数据传送
163
TCP 的连接的释放
164
数据传输结束后,通信的双方都可释放连接。 现在 A 的应用进程先向其 TCP 发出连接释放 报文段,并停止再发送数据,主动关闭 TCP
客户 服务器 A B 主动关闭 ESTAB- LISHED 数据传送 ESTAB- LISHED FIN = 1, seq = u 数据传输结束后,通信的双方都可释放连接。 现在 A 的应用进程先向其 TCP 发出连接释放 报文段,并停止再发送数据,主动关闭 TCP 连接。 A 把连接释放报文段首部的 FIN = 1,其序号 seq = u,等待 B 的确认。 CLOSED CLOSED
165
从 A 到 B 这个方向的连接就释放了,TCP 连接 处于半关闭状态。B 若发送数据,A 仍要接收。
客户 服务器 A B 主动关闭 ESTAB- LISHED 数据传送 通知 应用 进程 ESTAB- LISHED FIN = 1, seq = u ACK = 1, seq = v, ack= u 1 B 发出确认,确认号 ack = u 1, 而这个报文段自己的序号 seq = v。 TCP 服务器进程通知高层应用进程。 从 A 到 B 这个方向的连接就释放了,TCP 连接 处于半关闭状态。B 若发送数据,A 仍要接收。
166
若 B 已经没有要向 A 发送的数据, 其应用进程就通知 TCP 释放连接。 FIN = 1, seq = u 客户 服务器 A B
被动关闭 主动关闭 通知 应用 进程 ESTAB- LISHED 数据传送 ESTAB- LISHED FIN = 1, seq = u ACK = 1, seq = v, ack= u 1 数据传送 FIN = 1, ACK = 1, seq = w, ack= u 1 若 B 已经没有要向 A 发送的数据, 其应用进程就通知 TCP 释放连接。
167
A 收到连接释放报文段后,必须发出确认。 FIN = 1, seq = u 客户 服务器 A B 被动关闭 主动关闭 通知 应用 进程
ESTAB- LISHED 数据传送 ESTAB- LISHED FIN = 1, seq = u ACK = 1, seq = v, ack= u 1 数据传送 FIN = 1, ACK = 1, seq = w, ack= u 1 ACK = 1, seq = u + 1, ack = w 1 A 收到连接释放报文段后,必须发出确认。
168
5.9.2 TCP 的连接释放 在确认报文段中 ACK = 1,确认号 ack w 1, 自己的序号 seq = u + 1。
客户 服务器 A B 被动关闭 主动关闭 通知 应用 进程 ESTAB- LISHED 数据传送 ESTAB- LISHED FIN = 1, seq = u ACK = 1, seq = v, ack= u 1 数据传送 FIN = 1, ACK = 1, seq = w, ack= u 1 ACK = 1, seq = u + 1, ack = w 1 在确认报文段中 ACK = 1,确认号 ack w 1, 自己的序号 seq = u + 1。
169
TCP 连接必须经过时间 2MSL 后才真正释放掉。 5.9.2 TCP 的连接释放 FIN = 1, seq = u 客户 服务器 A
B 主动关闭 通知 应用 进程 ESTAB- LISHED 数据传送 ESTAB- LISHED FIN = 1, seq = u FIN- WAIT-1 ACK = 1, seq = v, ack= u 1 CLOSE- WAIT 数据传送 被动关闭 FIN- WAIT-2 FIN = 1, ACK = 1, seq = w, ack= u 1 LAST- ACK 等待 2MSL TIME- WAIT ACK = 1, seq = u + 1, ack = w 1 CLOSED CLOSED
170
A 必须等待 2MSL 的时间 第一,为了保证 A 发送的最后一个 ACK 报文段能够到达 B。
第二,防止 “已失效的连接请求报文段”出现在本连接中。A 在发送完最后一个 ACK 报文段后,再经过时间 2MSL,就可以使本连接持续的时间内所产生的所有报文段,都从网络中消失。这样就可以使下一个新的连接中不会出现这种旧的连接请求报文段。 课件制作人:谢希仁
171
5.9.3 TCP 的有限状态机 TCP 有限状态机的图中每一个方框都是 TCP 可能具有的状态。
箭头旁边的字,表明引起这种变迁的原因,或表明发生状态变迁后又出现什么动作。 图中有三种不同的箭头。 粗实线箭头表示对客户进程的正常变迁。 粗虚线箭头表示对服务器进程的正常变迁。 另一种细线箭头表示异常变迁。
172
TCP 的 有 限 状 态 机 起点 CLOSED 被动打开 主动打开 发送 SYN 关闭 收到 SYN 发送 SYN, ACK
LISTEN TCP 的 有 限 状 态 机 被动打开 收到 RST 发送 SYN 关闭 或超时 收到 SYN,发送 SYN, ACK SYN_RCVD SYN_SENT 同时打开 主动打开 收到 ACK 收到 SYN, ACK 发送 ACK 数据传送 阶段 收到 FIN 发送 ACK 被动关闭 关闭 发送 FIN ESTABLISHED CLOSE_WAIT 关闭 发送 FIN 主动关闭 关闭 发送 FIN 收到 FIN 发送 ACK 同时关闭 FIN_WAIT_1 CLOSING 收到 ACK 收到 FIN, ACK 发送 ACK LAST_ACK 收到 ACK 收到 ACK 收到 FIN 发送 ACK FIN_WAIT_2 TIME_WAIT 定时经过两倍报文段寿命后
Similar presentations