Presentation is loading. Please wait.

Presentation is loading. Please wait.

第 6 章 网络互连.

Similar presentations


Presentation on theme: "第 6 章 网络互连."— Presentation transcript:

1 第 6 章 网络互连

2 第 6 章 网络互连 6.1.1 路由器的构成 6.1.2 交换构件 6.1.3 互联网与因特网 *6.2 因特网的网际协议 IP
第 6 章 网络互连 *6.1 路由器在网际互连中的作用 路由器的构成 交换构件 互联网与因特网 *6.2 因特网的网际协议 IP 分类的 IP地址 IP 地址与硬件地址 地址解析协议 ARP 和逆地址解析协议 RARP IP 数据报的格式 IP 层处理数据报的流程

3 第 6 章 网络互连(续) *6.3 划分子网和构造超网 6.3.1 划分子网 6.3.2 使用子网掩码的分组转发过程
第 6 章 网络互连(续) *6.3 划分子网和构造超网 划分子网 使用子网掩码的分组转发过程 无分类编址 CIDR *6.4 因特网控制报文协议 ICMP *6.5 因特网的路由选择协议 有关路由选择协议的几个基本概念 内部网关协议 RIP 内部网关协议 OSPF 外部网关协议 BGP

4 第 6 章 网络互连(续) 6.6 IP 多播和因特网组管理协议 IGMP 6.6.1 IP 多播的基本概念
第 6 章 网络互连(续) 6.6 IP 多播和因特网组管理协议 IGMP IP 多播的基本概念 因特网组管理协议 IGMP 多播路由选择 *6.7 虚拟专用网 VPN 和网络地址转换 NAT 6.8 下一代的网际协议 IPv6 (IPng) * 解决 IP 地址耗尽的措施 * IPv6 的基本首部 IPv6 的扩展首部 IPv6 的地址空间 从 IPv4 到 IPv6 的过渡 ICMPv6

5 6.1 路由器在网际互连中的作用 路由器的构成 当主机 A 要向另一个主机 B 发送数据报时,先要检查目的主机 B 是否与源主机 A 连接在同一个网络上。 如果是,就将数据报直接交付给目的主机 B 而不需要通过路由器。 但如果目的主机与源主机 A 不是连接在同一个网络上,则应将数据报发送给本网络上的某个路由器,由该路由器按照转发表指出的路由将数据报转发给下一个路由器。这就叫作间接交付。

6 直接交付和间接交付 C A 直接交付 间接交付 间接交付 间接交付 直接交付 B 直接交付不需要使用路由器 但间接交付就必须使用路由器

7 典型的路由器的结构 路由选择处理机 3——网络层 2——数据链路层 1——物理层 路由 选择 分组 转发 交换结构 路由选择协议 路由表
输入端口 输出端口 1 2 3 3 2 1 分组处理 转发表 分组 转发 输入端口 输出端口 1 2 3 交换结构 3 2 1

8 “转发”和“路由选择”的区别 “转发”(forwarding)就是路由器根据转发表将用户的 IP 数据报从合适的端口转发出去。
“路由选择”(routing)则是按照分布式算法,根据从各相邻路由器得到的关于网络拓扑的变化 情况,动态地改变所选择的路由。 路由表是根据路由选择算法得出的。而转发表是从路由表得出的。 在讨论路由选择的原理时,往往不去区分转发表和路由表的区别,

9 输入端口对线路上收到的分组的处理 数据链路层剥去帧首部和尾部后,将分组送到网络层的队列中排队等待处理。这会产生一定的时延。 输入端口的处理
网络层处理 分组排队 线 数据链路层 处理 物理层处理 查表和转发

10 输出端口将交换结构传送来的分组发送到线路
当交换结构传送过来的分组先进行缓存。数据链路层处理模块将分组加上链路层的首部和尾部,交给物理层后发送到外部线路。 输出端口的处理 线 网络层处理 分组排队 数据链路层 处理 物理层处理 缓存管理

11 分组丢弃 若路由器处理分组的速率赶不上分组进入队列的速率,则队列的存储空间最终必定减少到零,这就使后面再进入队列的分组由于没有存储空间而只能被丢弃。 路由器中的输入或输出队列产生溢出是造成分组丢失的重要原因。

12 6.1.2 交换结构 总线 I1 O1 I1 O1 I2 存 储 器 I2 O2 O2 I3 I3 O3 O3 (a) 通过存储器
交换结构 总线 I1 O1 I1 O1 I2 I2 O2 O2 I3 I3 O3 O3 (a) 通过存储器 (b) 通过总线 I1 互连网络 I2 I3 O2 (c) 通过互连网络 O1 O3

13 6.1.3 互联网与因特网 互连在一起的网络要进行通信,会遇到许多问题需要解决,如: 不同的寻址方案 不同的最大分组长度 不同的网络接入机制
互联网与因特网 互连在一起的网络要进行通信,会遇到许多问题需要解决,如: 不同的寻址方案 不同的最大分组长度 不同的网络接入机制 不同的超时控制 不同的差错恢复方法 不同的状态报告方法 不同的路由选择技术 不同的用户接入控制 不同的服务(面向连接服务和无连接服务) 不同的管理与控制方式

14 网络互相连接起来 要使用一些中间设备 中间设备又称为中间系统或中继(relay)系统。 物理层中继系统:转发器(repeater)。
数据链路层中继系统:网桥或桥接器(bridge)。 网络层中继系统:路由器(router)。 网桥和路由器的混合物:桥路器(brouter)。 网络层以上的中继系统:网关(gateway)。

15 网络互连使用路由器 当中继系统是转发器或网桥时,一般并不称之为网络互连,因为这仅仅是把一个网络扩大了,而这仍然是一个网络。
网关由于比较复杂,目前使用得较少。 互联网都是指用路由器进行互连的网络。 由于历史的原因,许多有关 TCP/IP 的文献将网络层使用的路由器称为网关。

16 互连网络与虚拟互连网络 路由器 网络 网络 虚拟互连网络 (IP 网) 网络 网络 网络 (a) 互连网络 (b) 虚拟互连网络

17 虚拟互连网络的意义 所谓虚拟互连网络也就是逻辑互连网络,它的意思就是互连起来的各种物理网络的异构性本来是客观存在的,但是我们利用 IP 协议就可以使这些性能各异的网络从用户看起来好像是一个统一的网络。 使用 IP 协议的虚拟互连网络可简称为 IP 网。 使用虚拟互连网络的好处是:当互联网上的主机进行通信时,就好像在一个网络上通信一样,而看不见互连的各具体的网络异构细节。

18 名词 internet 和 Internet 以小写字母 i 开始的 internet(互联网或互连网)是一个通用名词,它泛指由多个计算机网络互连而成的虚拟网络。 以大写字母 I 开始的的 Internet(因特网)则是一个专用名词,它指当前全球最大的、开放的、由众多网络相互连接而成的特定计算机网络,它采用 TCP/IP 协议族,且其前身是美国的 ARPANET。

19 6.2 因特网的网际协议 IP 网际协议 IP 是 TCP/IP 体系中两个最主要的协议之一 。与 IP 协议配套使用的还有四个协议:
地址解析协议 ARP (Address Resolution Protocol) 逆地址解析协议 RARP (Reverse Address Resolution Protocol) 因特网控制报文协议 ICMP (Internet Control Message Protocol) 因特网组管理协议 IGMP (Internet Group Management Protocol)

20 网际协议 IP 及其配套协议 各种应用层协议 应用层 (TELNET, FTP, SMTP 等) 运输层 TCP, UDP ICMP
IGMP 网际层 IP RARP ARP 与各种网络接口 网络接口层 物理硬件

21 分类的 IP 地址 1. IP 地址及其表示方法 我们把整个因特网看成为一个单一的、抽象的网络。IP 地址就是给每个连接在因特网上的主机(或路由器)分配一个在全世界范围是惟一的 32 bit 的标识符。 IP 地址现在由因特网名字与号码指派公司ICANN (Internet Corporation for Assigned Names and Numbers)进行分配

22 IP 地址的编址方法 分类的 IP 地址。这是最基本的编址方法,在 1981 年就通过了相应的标准协议。
子网的划分。这是对最基本的编址方法的改进,其标准[RFC 950]在 1985 年通过。 构成超网。这是比较新的无分类编址方法。1993 年提出后很快就得到推广应用。

23 分类 IP 地址 每一类地址都由两个固定长度的字段组成,其中一个字段是网络号 net-id,它标志主机(或路由器)所连接到的网络,而另一个字段则是主机号 host-id,它标志该主机(或路由器)。 两级的 IP 地址可以记为: IP 地址 ::= { <网络号>, <主机号>} (6-1) ::= 代表“定义为”

24 IP 地址中的网络号字段和主机号字段 A 类地址 net-id 8 bit host-id 24 bit B 类地址 1 net-id
net-id 8 bit host-id 24 bit B 类地址 1 net-id 16 bit host-id 16 bit C 类地址 1 1 net-id 24 bit host-id 8 bit D 类地址 多 播 地 址 E 类地址 保 留 为 今 后 使 用

25 IP 地址中的网络号字段和主机号字段 A 类地址的网络号字段 net-id 为 1 字节 A 类地址 net-id 8 bit
net-id 8 bit host-id 24 bit B 类地址 1 net-id 16 bit host-id 16 bit C 类地址 1 1 net-id 24 bit host-id 8 bit A 类地址的网络号字段 net-id 为 1 字节 D 类地址 多 播 地 址 E 类地址 保 留 为 今 后 使 用

26 IP 地址中的网络号字段和主机号字段 B 类地址的网络号字段 net-id 为 2 字节 A 类地址 net-id 8 bit
net-id 8 bit host-id 24 bit B 类地址 1 net-id 16 bit host-id 16 bit C 类地址 1 1 net-id 24 bit host-id 8 bit B 类地址的网络号字段 net-id 为 2 字节 D 类地址 多 播 地 址 E 类地址 保 留 为 今 后 使 用

27 IP 地址中的网络号字段和主机号字段 C 类地址的网络号字段 net-id 为 3 字节 A 类地址 net-id 8 bit
net-id 8 bit host-id 24 bit B 类地址 1 net-id 16 bit host-id 16 bit C 类地址 1 1 net-id 24 bit host-id 8 bit C 类地址的网络号字段 net-id 为 3 字节 D 类地址 多 播 地 址 E 类地址 保 留 为 今 后 使 用

28 IP 地址中的网络号字段和主机号字段 A 类地址的主机号字段 host-id 为 3 字节 A 类地址 net-id 8 bit
net-id 8 bit host-id 24 bit B 类地址 1 net-id 16 bit host-id 16 bit C 类地址 1 1 net-id 24 bit host-id 8 bit A 类地址的主机号字段 host-id 为 3 字节 D 类地址 多 播 地 址 E 类地址 保 留 为 今 后 使 用

29 IP 地址中的网络号字段和主机号字段 B 类地址的主机号字段 host-id 为 2 字节 A 类地址 net-id 8 bit
net-id 8 bit host-id 24 bit B 类地址 1 net-id 16 bit host-id 16 bit C 类地址 1 1 net-id 24 bit host-id 8 bit B 类地址的主机号字段 host-id 为 2 字节 D 类地址 多 播 地 址 E 类地址 保 留 为 今 后 使 用

30 IP 地址中的网络号字段和主机号字段 C 类地址的主机号字段 host-id 为 1 字节 A 类地址 net-id 8 bit
net-id 8 bit host-id 24 bit B 类地址 1 net-id 16 bit host-id 16 bit C 类地址 1 1 net-id 24 bit host-id 8 bit C 类地址的主机号字段 host-id 为 1 字节 D 类地址 多 播 地 址 E 类地址 保 留 为 今 后 使 用

31 IP 地址中的网络号字段和主机号字段 D 类地址是多播地址 A 类地址 net-id 8 bit host-id 24 bit B 类地址
net-id 8 bit host-id 24 bit B 类地址 1 net-id 16 bit D 类地址是多播地址 host-id 16 bit C 类地址 1 1 net-id 24 bit host-id 8 bit D 类地址 多 播 地 址 E 类地址 保 留 为 今 后 使 用

32 IP 地址中的网络号字段和主机号字段 E 类地址保留为今后使用 A 类地址 net-id 8 bit host-id 24 bit
net-id 8 bit host-id 24 bit B 类地址 1 net-id 16 bit E 类地址保留为今后使用 host-id 16 bit C 类地址 1 1 net-id 24 bit host-id 8 bit D 类地址 多 播 地 址 E 类地址 保 留 为 今 后 使 用

33 路由器转发分组的步骤 先按所要找的 IP 地址中的网络号 net-id 把目的网络找到。
当分组到达目的网络后,再利用主机号host-id 将数据报直接交付给目的主机。 按照整数字节划分 net-id 字段和 host-id 字段,就可以使路由器在收到一个分组时能够更快地将地址中的网络号提取出来。

34 点分十进制记法 10000000000010110000001100011111 机器中存放的 IP 地址 是 32 bit 二进制代码
每隔 8 bit 插入一个空格 能够提高可读性 将每 8 bit 的二进制数 转换为十进制数 采用点分十进制记法 则进一步提高可读性

35 2. 常用的三种类别的 IP 地址 IP 地址的使用范围 网络 最大 第一个 最后一个 每个网络 类别 网络数 可用的 可用的 中最大的
网络 最大 第一个 最后一个 每个网络 类别 网络数 可用的 可用的 中最大的 网络号 网络号 主机数 A (27 – 2) ,777,214 B ,384 (214) ,534 C ,097,152 (221)

36 IP 地址的一些重要特点 (1) IP 地址是一种分等级的地址结构。分两个等级的好处是:
第一,IP 地址管理机构在分配 IP 地址时只分配网络号,而剩下的主机号则由得到该网络号的单位自行分配。这样就方便了 IP 地址的管理。 第二,路由器仅根据目的主机所连接的网络号来转发分组(而不考虑目的主机号),这样就可以使路由表中的项目数大幅度减少,从而减小了路由表所占的存储空间。

37 IP 地址的一些重要特点 (2) 实际上 IP 地址是标志一个主机(或路由器)和一条链路的接口。
当一个主机同时连接到两个网络上时,该主机就必须同时具有两个相应的 IP 地址,其网络号 net-id 必须是不同的。这种主机称为多接口主机(multihomed host)。 由于一个路由器至少应当连接到两个网络(这样它才能将 IP 数据报从一个网络转发到另一个网络),因此一个路由器至少应当有两个不同的 IP 地址。

38 IP 地址的一些重要特点 (3) 用转发器或网桥连接起来的若干个局域网仍为一个网络,因此这些局域网都具有同样的网络号 net-id。

39 图中的网络号就是 IP 地址中的 net-id
在同一个局域网上的主机或路由器的 IP 地址中的网络号必须是一样的。 图中的网络号就是 IP 地址中的 net-id LAN1 R1 LAN3 N3 LAN2 N2 R3 N1 R2 B 互联网

40 图中的网络号就是 IP 地址中的 net-id
在同一个局域网上的主机或路由器的 IP 地址中的网络号必须是一样的。 图中的网络号就是 IP 地址中的 net-id LAN1 R1 LAN3 N3 LAN2 N2 R3 N1 R2 B 互联网

41 图中的网络号就是 IP 地址中的 net-id
LAN1 R1 LAN3 在同一个局域网上的主机或路由器的 IP 地址中的网络号必须是一样的。 图中的网络号就是 IP 地址中的 net-id N3 LAN2 N2 R3 N1 R2 B 互联网

42 图中的网络号就是 IP 地址中的 net-id
在同一个局域网上的主机或路由器的 IP 地址中的网络号必须是一样的。 图中的网络号就是 IP 地址中的 net-id LAN1 R1 LAN3 N3 LAN2 N2 R3 N1 R2 B 互联网

43 路由器总是具有两个或两个以上的 IP 地址。
路由器的每一个接口都有一个 不同网络号的 IP 地址。 LAN1 R1 LAN3 N3 LAN2 N2 R3 N1 R2 B 互联网

44 路由器总是具有两个或两个以上的 IP 地址。
路由器的每一个接口都有一个 不同网络号的 IP 地址。 LAN1 R1 LAN3 N3 LAN2 N2 R3 N1 R2 B 互联网

45 路由器总是具有两个或两个以上的 IP 地址。
路由器的每一个接口都有一个 不同网络号的 IP 地址。 LAN1 R1 LAN3 N3 LAN2 N2 R3 N1 R2 B 互联网

46 互联网中的 IP 地址 两个路由器直接相连的接口处,可指明也可不指明 IP 地址。如指明 IP 地址,则这一段连线就构成了一种只包含一段线路的特殊“网络” 。现在常不指明 IP 地址。 LAN1 R1 LAN3 N3 LAN2 N2 R3 N1 R2 B 互联网

47 6.2.2 IP 地址与硬件地址 首部 应用层数据 网络层及以上 使用 IP 地址 IP 地址 TCP 报文 首部 链路层及以下
使用硬件地址 硬件地址 IP 数据报 首部 尾部 MAC 帧

48 查找路由表 查找路由表 通信的路径 H1→经过 R1 转发→再经过 R2 转发→H2 主机 H1 主机 H2 IP1 硬件地址 IP2
HA1 HA3 HA4 HA5 HA6 HA2 局域网 局域网 局域网 通信的路径 H1→经过 R1 转发→再经过 R2 转发→H2

49 从协议栈的层次上看数据的流动 IP 层上的互联网 主机 H1 主机 H2 IP1 硬件地址 IP2 路由器 R1 路由器 R2 HA1
局域网 局域网 局域网 主机 H1 主机 H2 IP 数据报 路由器 R1 路由器 R2 IP1 → IP2 IP1 → IP2 IP1 → IP2 IP1 IP2 IP3 IP4 IP5 IP6 IP 层上的互联网 HA1 HA3 HA4 HA5 HA6 HA2 从 HA1 到 HA3 从 HA4 到 HA5 从 HA6 到 HA2 MAC 帧 MAC 帧 MAC 帧

50 从虚拟的 IP 层上看 IP 数据报的流动 IP 层上的互联网 主机 H1 主机 H2 IP1 硬件地址 IP2 路由器 R1 路由器 R2
HA1 HA3 HA4 HA5 HA6 HA2 局域网 局域网 局域网 主机 H1 主机 H2 IP 数据报 路由器 R1 路由器 R2 IP1 → IP2 IP1 → IP2 IP1 → IP2 IP1 IP2 IP3 IP4 IP5 IP6 IP 层上的互联网 HA1 HA3 HA4 HA5 HA6 HA2 从 HA1 到 HA3 从 HA4 到 HA5 从 HA6 到 HA2 MAC 帧 MAC 帧 MAC 帧

51 在链路上看 MAC 帧的流动 IP 层上的互联网 主机 H1 主机 H2 IP1 硬件地址 IP2 路由器 R1 路由器 R2 HA1
局域网 局域网 局域网 主机 H1 主机 H2 IP 数据报 路由器 R1 路由器 R2 IP1 → IP2 IP1 → IP2 IP1 → IP2 IP1 IP2 IP3 IP4 IP5 IP6 IP 层上的互联网 HA1 HA3 HA4 HA5 HA6 HA2 从 HA1 到 HA3 从 HA4 到 HA5 从 HA6 到 HA2 MAC 帧 MAC 帧 MAC 帧

52 在 IP 层抽象的互联网上只能看到 IP 数据报 图中的 IP1→IP2 表示从源地址 IP1 到目的地址 IP2
主机 H1 主机 H2 IP 数据报 路由器 R1 路由器 R2 IP1 → IP2 IP1 IP2 IP3 IP4 IP5 IP6 IP 层上的互联网 HA1 HA3 HA4 HA5 HA6 HA2 从 HA1 到 HA3 从 HA4 到 HA5 从 HA6 到 HA2 MAC 帧 MAC 帧 MAC 帧

53 路由器只根据目的站的 IP 地址的网络号进行路由选择
主机 H1 主机 H2 IP 数据报 路由器 R1 路由器 R2 IP1 → IP2 IP1 → IP2 IP1 → IP2 IP1 IP2 IP3 IP4 IP5 IP6 IP 层上的互联网 HA1 HA3 HA4 HA5 HA6 HA2 从 HA1 到 HA3 从 HA4 到 HA5 从 HA6 到 HA2 MAC 帧 MAC 帧 MAC 帧

54 在具体的物理网络的链路层 只能看见 MAC 帧而看不见 IP 数据报 IP 层上的互联网 主机 H1 主机 H2 IP 数据报 路由器 R1
HA1 HA3 HA4 HA5 HA6 HA2 MAC 帧 从 HA1 到 HA3 从 HA4 到 HA5 从 HA6 到 HA2

55 IP层抽象的互联网屏蔽了下层很复杂的细节
在抽象的网络层上讨论问题,就能够使用 统一的、抽象的 IP 地址 研究主机和主机或主机和路由器之间的通信 主机 H1 主机 H2 IP 数据报 路由器 R1 路由器 R2 IP1 → IP2 IP1 → IP2 IP1 → IP2 IP1 IP2 IP3 IP4 IP5 IP6 IP 层上的互联网 HA1 HA3 HA4 HA5 HA6 HA2 MAC 帧 从 HA1 到 HA3 从 HA4 到 HA5 从 HA6 到 HA2

56 6.2.3 地址解析协议 ARP 和 逆地址解析协议 RARP
不管网络层使用的是什么协议,在实际网络的链路上传送数据帧时,最终还是必须使用硬件地址。 每一个主机都设有一个 ARP 高速缓存(ARP cache),里面有所在的局域网上的各主机和路由器的 IP 地址到硬件地址的映射表。 当主机 A 欲向本局域网上的某个主机 B 发送 IP 数据报时,就先在其 ARP 高速缓存中查看有无主机 B 的 IP 地址。如有,就可查出其对应的硬件地址,再将此硬件地址写入 MAC 帧,然后通过局域网将该 MAC 帧发往此硬件地址。

57 主机 A 广播发送 ARP 请求分组 主机 B 向 A 发送 ARP 响应分组
我是 ,硬件地址是 C0-15-AD-18 我想知道主机 的硬件地址 ARP 请求 ARP 请求 ARP 请求 ARP 请求 X Y Z A B 00-00-C0-15-AD-18 主机 B 向 A 发送 ARP 响应分组 我是 硬件地址是 B-00-EE-0A ARP 响应 X Y Z A B 00-00-C0-15-AD-18 B-00-EE-0A

58 ARP 高速缓存的作用 为了减少网络上的通信量,主机 A 在发送其 ARP 请求分组时,就将自己的 IP 地址到硬件地址的映射写入 ARP 请求分组。 当主机 B 收到 A 的 ARP 请求分组时,就将主机 A 的这一地址映射写入主机 B 自己的 ARP 高速缓存中。这对主机 B 以后向 A 发送数据报时就更方便了。

59 应当注意的问题 ARP 是解决同一个局域网上的主机或路由器的 IP 地址和硬件地址的映射问题。

60 应当注意的问题 从IP地址到硬件地址的解析是自动进行的,主机的用户对这种地址解析过程是不知道的。
只要主机或路由器要和本网络上的另一个已知 IP 地址的主机或路由器进行通信,ARP 协议就会自动地将该 IP 地址解析为链路层所需要的硬件地址。

61 什么我们不直接 使用硬件地址进行通信? 由于全世界存在着各式各样的网络,它们使用不同的硬件地址。要使这些异构网络能够互相通信就必须进行非常复杂的硬件地址转换工作,因此几乎是不可能的事。 连接到因特网的主机都拥有统一的 IP 地址,它们之间的通信就像连接在同一个网络上那样简单方便,因为调用 ARP 来寻找某个路由器或主机的硬件地址都是由计算机软件自动进行的,对用户来说是看不见这种调用过程的。

62 逆地址解析协议 RARP 逆地址解析协议 RARP 使只知道自己硬件地址的主机能够知道其 IP 地址。

63 6.2.4 IP 数据报的格式 一个 IP 数据报由首部和数据两部分组成。
在首部的固定部分的后面是一些可选字段,其长度是可变的。

64 比特 1 2 3 4 5 6 7 优 先 级 D T R C 未用 比特 4 8 16 19 24 31 版 本 首部长度 服 务 类 型 总 长 度 标 识 标志 片 偏 移 生 存 时 间 协 议 首 部 检 验 和 源 地 址 目 的 地 址 可变 部分 可 选 字 段 (长 度 可 变) 填 充 数 据 部 分 传送 首 部 数 据 部 分 IP 数据报

65 比特 1 2 3 4 5 6 7 优 先 级 D T R C 未用 比特 4 8 16 19 24 31 版 本 首部长度 服 务 类 型 总 长 度 标 识 标志 片 偏 移 生 存 时 间 协 议 首 部 检 验 和 源 地 址 目 的 地 址 可变 部分 可 选 字 段 (长 度 可 变) 填 充 数 据 部 分 传送 首 部 数 据 部 分 IP 数据报

66 比特 1 2 3 4 5 6 7 优 先 级 D T R C 未用 比特 4 8 16 19 24 31 版 本 首部长度 服 务 类 型 总 长 度 标 识 标志 片 偏 移 生 存 时 间 协 议 首 部 检 验 和 源 地 址 目 的 地 址 可变 部分 可 选 字 段 (长 度 可 变) 填 充 数 据 部 分 传送 首 部 数 据 部 分 IP 数据报

67 版本——占 4 bit,指IP协议的版本 目前的 IP 协议版本号为 4 (即 IPv4) 比特 1 2 3 4 5 6 7 优 先 级 D
1 2 3 4 5 6 7 优 先 级 D T R C 未用 比特 4 8 16 19 24 31 版本——占 4 bit,指IP协议的版本 目前的 IP 协议版本号为 4 (即 IPv4) 版 本 首部长度 服 务 类 型 总 长 度 标 识 标志 片 偏 移 生 存 时 间 协 议 首 部 检 验 和 源 地 址 目 的 地 址 可变 部分 可 选 字 段 (长 度 可 变) 填 充 数 据 部 分

68 首部长度——占 4 bit,可表示的最大数值 是 15 个单位(一个单位为 4 字节) 因此 IP 的首部长度的最大值是60字节。 比特 1
1 2 3 4 5 6 7 优 先 级 D T R C 未用 比特 4 8 16 19 24 31 版 本 首部长度——占 4 bit,可表示的最大数值 是 15 个单位(一个单位为 4 字节) 因此 IP 的首部长度的最大值是60字节。 首部长度 服 务 类 型 总 长 度 标 识 标志 片 偏 移 生 存 时 间 协 议 首 部 检 验 和 源 地 址 目 的 地 址 可变 部分 可 选 字 段 (长 度 可 变) 填 充 数 据 部 分

69 服务类型——占 8 bit,用来获得更好的服务
比特 1 2 3 4 5 6 7 优 先 级 D T R C 未用 比特 4 8 16 19 24 31 版 本 服务类型——占 8 bit,用来获得更好的服务 这个字段以前一直没有被人们使用 首部长度 服 务 类 型 总 长 度 标 识 标志 片 偏 移 生 存 时 间 协 议 首 部 检 验 和 源 地 址 目 的 地 址 可变 部分 可 选 字 段 (长 度 可 变) 填 充 数 据 部 分

70 总长度——占 16 bit,指首部和数据之和的长度, 单位为字节,因此数据报的最大长度为 65535 字节。
比特 1 2 3 4 5 6 7 优 先 级 D T R C 未用 比特 4 8 16 19 24 31 总长度——占 16 bit,指首部和数据之和的长度, 单位为字节,因此数据报的最大长度为 字节。 总长度必须不超过最大传送单元 MTU。 版 本 首部长度 服 务 类 型 总 长 度 标 识 标志 片 偏 移 生 存 时 间 协 议 首 部 检 验 和 源 地 址 目 的 地 址 可变 部分 可 选 字 段 (长 度 可 变) 填 充 数 据 部 分

71 标识(identification) 占 16 bit,
比特 1 2 3 4 5 6 7 优 先 级 D T R C 未用 比特 4 8 16 19 24 31 版 本 首部长度 服 务 类 型 总 长 度 标识(identification) 占 16 bit, 它是一个计数器,用来产生数据报的标识。 标 识 标志 片 偏 移 生 存 时 间 协 议 首 部 检 验 和 源 地 址 目 的 地 址 可变 部分 可 选 字 段 (长 度 可 变) 填 充 数 据 部 分

72 标识(identification) 占 16 bit,
比特 1 2 3 4 5 6 7 优 先 级 D T R C 未用 比特 4 8 16 19 24 31 版 本 首部长度 服 务 类 型 总 长 度 标识(identification) 占 16 bit, 它是一个计数器,用来产生数据报的标识。 标 识 标志 片 偏 移 生 存 时 间 协 议 首 部 检 验 和 源 地 址 目 的 地 址 可变 部分 可 选 字 段 (长 度 可 变) 填 充 数 据 部 分

73 片偏移(12 bit)指出:较长的分组在分片后
比特 1 2 3 4 5 6 7 优 先 级 D T R C 未用 比特 4 8 16 19 24 31 版 本 首部长度 服 务 类 型 总 长 度 片偏移(12 bit)指出:较长的分组在分片后 某片在原分组中的相对位置。 片偏移以 8 个字节为偏移单位。 标 识 标志 片 偏 移 生 存 时 间 协 议 首 部 检 验 和 源 地 址 目 的 地 址 可变 部分 可 选 字 段 (长 度 可 变) 填 充 数 据 部 分

74 IP 数据报分片的举例 数据部分共 3800 字节 需分片的 数据报 偏移 = 0/8 = 0 首部 字节 0 1400 2800 3799
首部 1 首部 2 首部 3 字节 0 1399 1400 2799 2800 3799 数据报片 1 数据报片 2 数据报片 3 偏移 = 0/8 = 0 偏移 = 1400/8 = 175 偏移 = 2800/8 = 350

75 生存时间(8 bit)记为 TTL (Time To Live)
比特 1 2 3 4 5 6 7 优 先 级 D T R C 未用 比特 4 8 16 19 24 31 版 本 首部长度 服 务 类 型 总 长 度 标 识 标志 片 偏 移 生存时间(8 bit)记为 TTL (Time To Live) 数据报在网络中的寿命,其单位为秒。 生 存 时 间 协 议 首 部 检 验 和 源 地 址 目 的 地 址 可变 部分 可 选 字 段 (长 度 可 变) 填 充 数 据 部 分

76 协议(8 bit)字段指出此数据报携带的数据使用何种协议 以便目的主机的 IP 层将数据部分上交给哪个处理过程
比特 1 2 3 4 5 6 7 优 先 级 D T R C 未用 比特 4 8 16 19 24 31 版 本 首部长度 服 务 类 型 总 长 度 标 识 标志 片 偏 移 协议(8 bit)字段指出此数据报携带的数据使用何种协议 以便目的主机的 IP 层将数据部分上交给哪个处理过程 生 存 时 间 协 议 首 部 检 验 和 源 地 址 目 的 地 址 可变 部分 可 选 字 段 (长 度 可 变) 填 充 数 据 部 分

77 运输层 TCP UDP ICMP IGMP OSPF 网络层 首部 数 据 部 分 协议字段指出应将数据 部分交给哪一个进程 IP 数据报

78 首部检验和(16 bit)字段只检验数据报的首部 不包括数据部分。 这里不采用 CRC 检验码而采用简单的计算方法。
比特 1 2 3 4 5 6 7 优 先 级 D T R C 未用 比特 4 8 16 19 24 31 版 本 首部长度 服 务 类 型 总 长 度 标 识 标志 片 偏 移 首部检验和(16 bit)字段只检验数据报的首部 不包括数据部分。 这里不采用 CRC 检验码而采用简单的计算方法。 生 存 时 间 协 议 首 部 检 验 和 源 地 址 目 的 地 址 可变 部分 可 选 字 段 (长 度 可 变) 填 充 数 据 部 分

79 发送端 接收端 字 1 字 1 16 bit 16 bit 字 2 字 2 16 bit 16 bit 置为全 0 检验和 16 bit 检验和 字 n 字 n 16 bit 16 bit 16 bit 反码算术 运算求和 16 bit 反码算术 运算求和 取反码 IP 数据报 取反码 16 bit 检验和 16 bit 结果 若结果为 0, 则保留; 否则,丢弃该数据报 数据部分 不参与检验和的计算 数据部分

80 源地址和目的地址都各占 4 字节 比特 1 2 3 4 5 6 7 优 先 级 D T R C 未用 比特 4 8 16 19 24 31
1 2 3 4 5 6 7 优 先 级 D T R C 未用 比特 4 8 16 19 24 31 版 本 首部长度 服 务 类 型 总 长 度 标 识 标志 片 偏 移 生 存 时 间 协 议 首 部 检 验 和 源地址和目的地址都各占 4 字节 源 地 址 目 的 地 址 可变 部分 可 选 字 段 (长 度 可 变) 填 充 数 据 部 分

81 2. IP 数据报首部的可变部分 IP 首部的可变部分就是一个选项字段,用来支持排错、测量以及安全等措施,内容很丰富。
选项字段的长度可变,从 1 个字节到 40 个字节不等,取决于所选择的项目。 增加首部的可变部分是为了增加 IP 数据报的功能,但这同时也使得 IP 数据报的首部长度成为可变的。这就增加了每一个路由器处理数据报的开销。 实际上这些选项很少被使用。

82 6.2.5 IP 层转发分组的流程 路由器和结点交换机有些区别: 路由器是用来连接不同的网络,而结点交换机只是在一个特定的网络中工作。
路由器是专门用来转发分组的,而结点交换机还可接上许多个主机。 路由器使用统一的 IP 协议,而结点交换机使用所在广域网的特定协议。 路由器根据目的网络地址找出下一个路由器,而结点交换机则根据目的站所接入的交换机号找出下一跳(即下一个结点交换机)。

83 在路由表中,对每一条路由,最主要的是 (目的网络地址,下一跳地址) 路由器 R2 的路由表 10.0.0.4 20.0.0.7
R1 R2 R3 网 1 网 2 网 3 网 4 1 路由器 R2 的路由表 目的主机所在的网络 下一跳路由器的地址 直接交付,接口 0 直接交付,接口 1 R1 R2 R3 链路 1 链路 2 链路 3 链路 4

84 特定主机路由 这种路由是为特定的目的主机指明一个路由。
采用特定主机路由可使网络管理人员能更方便地控制网络和测试网络,同时也可在需要考虑某种安全问题时采用这种特定主机路由。

85 分组转发算法 (1) 从数据报的首部提取目的站的 IP 地址 D, 得出目的网络地址为 N。
(2) 若网络 N 与此路由器直接相连,则直接将数据报交付给目的站 D;否则是间接交付,执行(3)。 (3) 若路由表中有目的地址为 D 的特定主机路由,则将数据报传送给路由表中所指明的下一跳路由器;否则,执行(4)。 (4) 若路由表中有到达网络 N 的路由,则将数据报传送给路由表指明的下一跳路由器;否则,执行(5)。 (5) 若路由表中有一个默认路由,则将数据报传送给路由表中所指明的默认路由器;否则,执行(6)。 (6) 报告转发分组出错。

86 必须强调指出 IP 数据报的首部中没有地方可以用来指明“下一跳路由器的 IP 地址”。
网络接口软件使用 ARP 负责将下一跳路由器的 IP 地址转换成硬件地址,并将此硬件地址放在链路层的 MAC 帧的首部,然后根据这个硬件地址找到下一跳路由器。

87 6.3 划分子网和构造超网 6.3.1 划分子网 1. 从两级 IP 地址到三级 IP 地址
6.3 划分子网和构造超网 划分子网 1. 从两级 IP 地址到三级 IP 地址 在 ARPANET 的早期,IP 地址的设计确实不够合理。 IP 地址空间的利用率有时很低。 给每一个物理网络分配一个网络号会使路由表变得太大因而使网络性能变坏。 两级的 IP 地址不够灵活。

88 三级的 IP 地址 从 1985 年起在 IP 地址中又增加了一个“子网号字段”,使两级的 IP 地址变成为三级的 IP 地址。
这种做法叫作划分子网(subnetting) 。划分子网已成为因特网的正式标准协议。

89 划分子网的基本思路 划分子网纯属一个单位内部的事情。单位对外仍然表现为没有划分子网的网络。
从主机号借用若干个比特作为子网号 subnet-id,而主 机号 host-id 也就相应减少了若干个比特。 IP地址 ::= {<网络号>, <子网号>, <主机号>} (6-2)

90 划分子网的基本思路(续) 凡是从其他网络发送给本单位某个主机的 IP 数据报,仍然是根据 IP 数据报的目的网络号 net-id,先找到连接在本单位网络上的路由器。 然后此路由器在收到 IP 数据报后,再按目的网络号 net-id 和子网号 subnet-id 找到目的子网。 最后就将 IP 数据报直接交付给目的主机。

91 网络 145.13.0.0 … … … 一个未划分子网的 B 类网络145.13.0.0 我的网络地址 是 145.13.0.0
R2 网络 R1 R3 所有到网络 的分组均到达此路由器

92 划分为三个子网后对外仍是一个网络 网络 145.13.0.0 所有到达网络 145.13.0.0 的分组均到达 此路由器
R2 子网 子网 R1 R3 子网 网络

93 划分子网后变成了三级结构 当没有划分子网时,IP 地址是两级结构,地址的网络号字段也就是 IP 地址的“因特网部分”,而主机号字段是 IP 地址的“本地部分”。 划分子网后 IP 地址就变成了三级结构。划分子网只是将 IP 地址的本地部分进行再划分,而不改变 IP 地址的因特网部分。

94 2. 子网掩码 从一个 I P数据报的首部并无法判断源主机或目的主机所连接的网络是否进行了子网的划分。
2. 子网掩码 从一个 I P数据报的首部并无法判断源主机或目的主机所连接的网络是否进行了子网的划分。 使用子网掩码(subnet mask)可以找出 IP 地址中的子网部分。

95 IP 地址的各字段和子网掩码 因特网部分 本地部分 两级 IP 地址 网络号 net-id 主机号 host-id 因特网部分 本地部分
subnet-id 子网号 host-id 网络号 主机号 子网掩码 划分子网时 的网络地址 net-id subnet-id host-id 为全 0

96 (IP 地址) AND (子网掩码) = 网络地址
因特网部分 本地部分 两级 IP 地址 网络号 net-id 主机号 host-id 因特网部分 本地部分 三级 IP 地址 net-id host-id subnet-id AND 网络号 子网号 主机号 子网掩码 划分子网时 的网络地址 net-id subnet-id host-id 为全 0

97 A 类、B 类和 C 类 IP 地址的默认子网掩码 A 类 地 址 网络地址 net-id host-id 为全 0 默认子网掩码
B 网络地址 net-id host-id 为全 0 默认子网掩码 C 网络地址 net-id host-id 为全 0 默认子网掩码

98 6.3.2 使用子网掩码的分组转发过程 在不划分子网的两级 IP 地址下,从 IP 地址得出网络地址是个很简单的事。
使用子网掩码的分组转发过程 在不划分子网的两级 IP 地址下,从 IP 地址得出网络地址是个很简单的事。 但在划分子网的情况下,从IP地址却不能惟一地得出网络地址来,这是因为网络地址取决于那个网络所采用的子网掩码,但数据报的首部并没有提供子网掩码的信息。 因此分组转发的算法也必须做相应的改动。

99 划分子网后分组的转发举例 R1 的路由表(未给出默认路由器) 子网2:网络地址 128.30.33.128
目的网络地址 子网掩码 下一跳 接口 0 接口 1 R2 子网1: 网络地址 子网掩码 H1 子网2:网络地址 子网掩码 1 H2 R2 1 子网3:网络地址 子网掩码 H3

100 请注意:H1 并不知道 H2 连接在哪一个网络上。 H1 仅仅知道 H2 的 IP 地址是 128.30.33.138
R1 的路由表(未给出默认路由器) 目的网络地址 子网掩码 下一跳 接口 0 接口 1 R2 子网1: 网络地址 子网掩码 H1 R1 子网2:网络地址 子网掩码 1 R2 H2 请注意:H1 并不知道 H2 连接在哪一个网络上。 H1 仅仅知道 H2 的 IP 地址是 因此 H1 首先检查主机 是否连接在本网络上 如果是,则直接交付; 否则,就送交路由器 R1,并逐项查找路由表。 1 子网3:网络地址 子网掩码 H3

101 主机 H1 首先将 本子网的子网掩码 255. 255. 255. 128 与分组的 IP 地址 128. 30. 33
主机 H1 首先将 本子网的子网掩码 与分组的 IP 地址 逐比特相“与”(AND 操作) R1 的路由表(未给出默认路由器) AND 的计算 H1 目的网络地址 子网掩码 下一跳 接口 0 接口 1 R2 子网1: 网络地址 子网掩码 255 就是二进制的全 1,因此 255 AND xyz = xyz, 这里只需计算最后的 128 AND 138 即可。 R1 子网2:网络地址 子网掩码 128 → 138 → 1 H2 逐比特 AND 操作后: → 128 R2 1 逐比特 AND 操作 子网3:网络地址 子网掩码  H1 的网络地址 H3

102 因此 H1 必须把分组传送到路由器 R1 然后逐项查找路由表
目的网络地址 子网掩码 下一跳 接口 0 接口 1 R2 子网1: 网络地址 子网掩码 H1 R1 子网2:网络地址 子网掩码 1 H2 R2 1 子网3:网络地址 子网掩码 H3

103 路由器 R1 收到分组后就用路由表中第 1 个项目的 子网掩码和 128.30.33.138 逐比特 AND 操作
R1 收到的分组的目的 IP 地址: R1 的路由表(未给出默认路由器) 目的网络地址 子网掩码 下一跳 接口 0 接口 1 R2 子网1: 网络地址 子网掩码 H1 R1 子网2:网络地址 子网掩码 不一致 1 R2 H2 AND = 不匹配! (因为 与路由表中的 不一致) 1 子网3:网络地址 子网掩码 H3

104 路由器 R1 再用路由表中第 2 个项目的 子网掩码和 128.30.33.138 逐比特 AND 操作
R1 收到的分组的目的 IP 地址: R1 的路由表(未给出默认路由器) 目的网络地址 子网掩码 下一跳 接口 0 接口 1 R2 子网1: 网络地址 子网掩码 H1 一致! R1 子网2:网络地址 子网掩码 1 R2 H2 AND = 匹配! 这表明子网 2 就是收到的分组所要寻找的目的网络 1 子网3:网络地址 子网掩码 H3

105 (1) 从收到的分组的首部提取目的 IP 地址 D。 (2) 先用各网络的子网掩码和 D 逐比特相“与”,看是否和
在划分子网的情况下路由器转发分组的算法 (1) 从收到的分组的首部提取目的 IP 地址 D。 (2) 先用各网络的子网掩码和 D 逐比特相“与”,看是否和 相应的网络地址匹配。若匹配,则将分组直接交付。 否则就是间接交付,执行(3)。 (3) 若路由表中有目的地址为 D 的特定主机路由,则将 分组传送给指明的下一跳路由器;否则,执行(4)。 (4) 对路由表中的每一行的子网掩码和 D 逐比特相“与”, 若其结果与该行的目的网络地址匹配,则将分组传送 给该行指明的下一跳路由器;否则,执行(5)。 (5) 若路由表中有一个默认路由,则将分组传送给路由表 中所指明的默认路由器;否则,执行(6)。 (6) 报告转发分组出错。

106 6.3.3 无分类编址 CIDR 1. 网络前缀 划分子网在一定程度上缓解了因特网在发展中遇
到的困难。然而在 1992 年因特网仍然面临三个必 须尽早解决的问题,这就是: B 类地址在 1992 年已分配了近一半,眼看就要在 1994 年 3 月全部分配完毕! 因特网主干网上的路由表中的项目数急剧增长(从几千个增长到几万个)。 整个 IPv4 的地址空间最终将全部耗尽。

107 IP 编址问题的演进 1987 年,RFC 1009 就指明了在一个划分子网的网络中可同时使用几个不同的子网掩码。使用变长子网掩码 VLSM (Variable Length Subnet Mask)可进一步提高 IP 地址资源的利用率。 在 VLSM 的基础上又进一步研究出无分类编址方法,它的正式名字是无分类域间路由选择 CIDR (Classless Inter-Domain Routing)。

108 CIDR 最主要的特点 CIDR 消除了传统的 A 类、B 类和 C 类地址以及划分子网的概念,因而可以更加有效地分配 IPv4 的地址空间。 CIDR使用各种长度的“网络前缀”(network-prefix)来代替分类地址中的网络号和子网号。 IP 地址从三级编址(使用子网掩码)又回到了两级编址。

109 无分类的两级编址 无分类的两级编址的记法是: IP地址 ::= {<网络前缀>, <主机号>} (6-3)
CIDR 还使用“斜线记法”(slash notation),它又称为CIDR记法,即在IP地址后面加上一个斜线“/”,然后写上网络前缀所占的比特数(这个数值对应于三级编址中子网掩码中比特 1 的个数)。 CIDR 将网络前缀都相同的连续的 IP 地址组成“CIDR地址块”。

110 CIDR 地址块 /20 表示的地址块共有 212 个地址(因为斜线后面的 20 是网络前缀的比特数,所以主机号的比特数是 12)。 这个地址块的起始地址是 。 在不需要指出地址块的起始地址时,也可将这样的地址块简称为“/20 地址块”。 /20 地址块的最小地址: /20 地址块的最大地址: 全 0 和全 1 的主机号地址一般不使用。

111 /20 表示的地址(212 个地址) 最小地址 所有地址 的 20 bit 前缀都是 一样的 最大地址

112 路由聚合(route aggregation)
一个 CIDR 地址块可以表示很多地址,这种地址的聚合常称为路由聚合,它使得路由表中的一个项目可以表示很多个(例如上千个)原来传统分类地址的路由。 路由聚合也称为构成超网(supernetting)。 CIDR 虽然不使用子网了,但仍然使用“掩码”这一名词(但不叫子网掩码)。 对于 /20 地址块,它的掩码是 20 个连续的 1。 斜线记法中的数字就是掩码中1的个数。

113 CIDR 记法的其他形式 /10 可简写为 10/10,也就是将点分十进制中低位连续的 0 省略。 /10 隐含地指出 IP 地址 的掩码是 。此掩码可表示为 掩码中有 10 个连续的 0 255 192

114 CIDR 记法的其他形式 10.0.0.0/10 可简写为 10/10,也就是将点分十进制中低位连续的 0 省略。
/10 相当于指出 IP 地址 的掩码是 ,即 网络前缀的后面加一个星号 * 的表示方法 如 *,在星号 * 之前是网络前缀,而星号 * 表示 IP 地址中的主机号,即

115 构成超网 前缀长度不超过 23 bit 的 CIDR 地址块都包含了多个 C 类地址。 这些 C 类地址合起来就构成了超网。
网络前缀越短,其地址块所包含的地址数就越多。而在三级结构的IP地址中,划分子网是使网络前缀变长。

116 CIDR 地址块划分举例 ISP 大学 X 因特网 三系 四系 二系 一系 206.0.64.0/18 206.0.68.0/22
/23 /24 /25 /25 /25 /25 /25 /25 /26 /26 /26 /26 /26 /26 /26 /26 三系 四系 二系 一系 单位 地址块 二进制表示 地址数 ISP / * 大学 / * 一系 / * 二系 / * 三系 / * 四系 / *

117 CIDR 地址块划分举例 ISP 大学 X /18 因特网 /22 /23 /24 /25 /25 /25 /25 /25 /25 /26 /26 /26 /26 /26 /26 /26 /26 三系 四系 二系 一系 这个 ISP 共有 64 个 C 类网络。如果不采用 CIDR 技术,则在与该 ISP 的路由器交换路由信息的每一个路由器的路由表中,就需要有 64 个项目。但采用地址聚合后,只需用路由聚合后的 1 个项目 /18 就能找到该 ISP。

118 2. 最长前缀匹配 使用 CIDR 时,路由表中的每个项目由“网络前缀”和“下一跳地址”组成。在查找路由表时可能会得到不止一个匹配结果。
应当从匹配结果中选择具有最长网络前缀的路由:最长前缀匹配(longest-prefix matching)。 网络前缀越长,其地址块就越小,因而路由就越具体。 最长前缀匹配又称为最长匹配或最佳匹配。

119 收到的分组的目的地址 D = 206.0.68.0/22 路由表中的项目:206.0.68.0/22 (ISP)
最长前缀匹配举例 收到的分组的目的地址 D = /22 路由表中的项目: / (ISP) /25 (四系) 查找路由表中的第 1 个项目 第 1 个项目 /22 的掩码 M 有 22 个连续的 1。 M = 因此只需把 D 的第 3 个字节转换成二进制。 M = AND D = 与 /22 匹配

120 收到的分组的目的地址 D = 206.0.68.0/22 路由表中的项目:206.0.68.0/22 (ISP)
最长前缀匹配举例 收到的分组的目的地址 D = /22 路由表中的项目: / (ISP) /25 (四系) 再查找路由表中的第 2 个项目 第 2 个项目 /25 的掩码 M 有 25 个连续的 1。 M = 因此只需把 D 的第 4 个字节转换成二进制。 M = AND D = 与 /25 匹配

121 最长前缀匹配 D AND ( ) = / 匹配 D AND ( ) = / 匹配 选择两个匹配的地址中更具体的一个,即选择最长前缀的地址。

122 3. 使用二叉线索查找路由表 当路由表的项目数很大时,怎样设法减小路由表的查找时间就成为一个非常重要的问题。
为了进行更加有效的查找,通常是将无分类编址的路由表存放在一种层次的数据结构中,然后自上而下地按层次进行查找。这里最常用的就是二叉线索(binary trie)。 IP 地址中从左到右的比特值决定了从根结点逐层向下层延伸的路径,而二叉线索中的各个路径就代表路由表中存放的各个地址。 为了提高二叉线索的查找速度,广泛使用了各种压缩技术。

123 6.4 因特网控制报文协议 ICMP 为了提高 IP 数据报交付成功的机会,在网际层使用了因特网控制报文协议 ICMP (Internet Control Message Protocol)。 ICMP 允许主机或路由器报告差错情况和提供有关异常情况的报告。 ICMP 不是高层协议,而是 IP 层的协议。 ICMP 报文作为 IP 层数据报的数据,加上数据报的首部,组成 IP 数据报发送出去。

124 ICMP 报文的格式 8 16 31 前 4 个字节 都是一样的 类型 代码 检验和 (这 4 个字节取决于 ICMP 报文的类型)
8 16 31 前 4 个字节 都是一样的 类型 代码 检验和 (这 4 个字节取决于 ICMP 报文的类型) ICMP 的数据部分(长度取决于类型) ICMP 报文 首 部 数 据 部 分 IP 数据报

125 ICMP 报文 ICMP 报文的种类有两种,即 ICMP 差错报告报文和 ICMP 询问报文。

126 ICMP 差错报告报文共有 5 种 终点不可达 源站抑制 时间超过 参数问题 改变路由(重定向)

127 ICMP 差错报告报文的数据字段的内容 IP 数据报的数据字段 收到的 IP 数据报 IP 数据报 首部 8 字节 ICMP 的
前 8 字节 IP 数据报 首部 8 字节 ICMP 差错报告报文 首部 ICMP 差错报告报文 装入 ICMP 报文的 IP 数据报 IP 数据报

128 不应发送 ICMP 差错报告报文 的几种情况 对 ICMP 差错报告报文不再发送 ICMP 差错报告报文。

129 ICMP 询问报文有四种 回送请求和回答报文 时间戳请求和回答报文 掩码地址请求和回答报文 路由器询问和通告报文

130 PING (Packet InterNet Groper)
PING 使用了 ICMP 回送请求与回送回答报文。 PING 是应用层直接使用网络层 ICMP 的例子,它没有通过运输层的 TCP 或UDP。

131 6.5 因特网的路由选择协议 6.5.1 有关路由选择协议的几个基本概念
6.5 因特网的路由选择协议 有关路由选择协议的几个基本概念 1. 理想的路由算法 算法必须是正确的和完整的。 算法在计算上应简单。 算法应能适应通信量和网络拓扑的变化,这就是说,要有自适应性。 算法应具有稳定性。 算法应是公平的。 算法应是最佳的。

132 代价 在研究路由选择时,需要给每一条链路指明一定的代价。
这里“代价”并不是指“钱”,而是由一个或几个因素综合决定的一种度量(metric),如链路长度、数据率、链路容量、是否要保密、传播时延等,甚至还可以是一天中某一个小时内的通信量、结点的缓存被占用的程度、链路差错率等。

133 最佳路由 不存在一种绝对的最佳路由算法。 所谓“最佳”只能是相对于某一种特定要求下得出的较为合理的选择而已。
实际的路由选择算法,应尽可能接近于理想的算法。 路由选择是个非常复杂的问题 它是网络中的所有结点共同协调工作的结果。 路由选择的环境往往是不断变化的,而这种变化有时无法事先知道。

134 从路由算法 的自适应性考虑 静态路由选择策略——即非自适应路由选择,其特点是简单和开销较小,但不能及时适应网络状态的变化。
动态路由选择策略——即自适应路由选择,其特点是能较好地适应网络状态的变化,但实现起来较为复杂,开销也比较大。

135 2. 分层次的路由选择协议 因特网采用分层次的路由选择协议。
2. 分层次的路由选择协议 因特网采用分层次的路由选择协议。 因特网的规模非常大。如果让所有的路由器知道所有的网络应怎样到达,则这种路由表将非常大,处理起来也太花时间。而所有这些路由器之间交换路由信息所需的带宽就会使因特网的通信链路饱和。 许多单位不愿意外界了解自己单位网络的布局细节和本部门所采用的路由选择协议(这属于本部门内部的事情),但同时还希望连接到因特网上。

136 自治系统(autonomous system)
因特网将整个互联网划分为许多较小的自治系统 AS。 一个自治系统是一个互联网,其最重要的特点就是自治系统有权自主地决定在本系统内应采用何种路由选择协议。 一个自治系统内的所有网络都属于一个行政单位(例如,一个公司,一所大学,政府的一个部门,等等)来管辖。 一个自治系统的所有路由器在本自治系统内都必须是连通的。

137 因特网有两大类路由选择协议 内部网关协议 IGP (Interior Gateway Protocol) 即在一个自治系统内部使用的路由选择协议。目前这类路由选择协议使用得最多,如 RIP 和 OSPF 协议。 外部网关协议EGP (External Gateway Protocol) 若源站和目的站处在不同的自治系统中,当数据报传到一个自治系统的边界时,就需要使用一种协议将路由选择信息传递到另一个自治系统中。这样的协议就是外部网关协议 EGP。在外部网关协议中目前使用最多的是 BGP-4。

138 自治系统和 内部网关协议、外部网关协议 自治系统 A 自治系统 B 自治系统 C R3 IGP EGP R2 IGP IGP IGP IGP
H1 IGP H2 IGP IGP IGP IGP 内部网关协议 IGP (例如,RIP) 外部网关协议 EGP (例如,BGP-4) 内部网关协议 IGP (例如,OSPF)

139 这里要指出两点 因特网的早期 RFC 文档中未使用“路由器”而是使用“网关”这一名词。但是在新的 RFC 文档中又使用了“路由器”这一名词。应当把这两个属于当作同义词。 IGP 和 EGP 是协议类别的名称。但 RFC 在使用 EGP 这个名词时出现了一点混乱,因为最早的一个外部网关协议的协议名字正好也是 EGP。因此在遇到名词 EGP 时,应弄清它是指旧的协议 EGP 还是指外部网关协议 EGP 这个类别。

140 因特网的路由选择协议 内部网关协议 IGP:具体的协议有多种,如 RIP 和 OSPF 等。
外部网关协议 EGP:目前使用的协议就是 BGP。

141 6.5.2 内部网关协议 RIP (Routing Information Protocol)
1. 工作原理 路由信息协议 RIP 是内部网关协议 IGP中最先得到广泛使用的协议。 RIP 是一种分布式的基于距离向量的路由选择协议。 RIP 协议要求网络中的每一个路由器都要维护从它自己到其他每一个目的网络的距离记录。

142 “距离”的定义 从一路由器到直接连接的网络的距离定义为 1。 从一个路由器到非直接连接的网络的距离定义为所经过的路由器数加 1。
RIP 协议中的“距离”也称为“跳数”(hop count),因为每经过一个路由器,跳数就加 1。

143 “距离”的定义 RIP 认为一个好的路由就是它通过的路由器的数目少,即“距离短”。 RIP 允许一条路径最多只能包含 15 个路由器。

144 RIP 协议的三个要点 仅和相邻路由器交换信息。 交换的信息是当前本路由器所知道的全部信息,即自己的路由表。
按固定的时间间隔交换路由信息,例如,每隔 30 秒。

145 路由表的建立 路由器在刚刚开始工作时,只知道到直接连接的网络的距离(此距离定义为1)。
以后,每一个路由器也只和数目非常有限的相邻路由器交换并更新路由信息。 经过若干次更新后,所有的路由器最终都会知道到达本自治系统中任何一个网络的最短距离和下一跳路由器的地址。 RIP 协议的收敛(convergence)过程较快,即在自治系统中所有的结点都得到正确的路由选择信息的过程。

146 2. 距离向量算法 收到相邻路由器(其地址为 X)的一个 RIP 报文:
(1) 先修改此 RIP 报文中的所有项目:将“下一跳”字段中的地址都改为 X,并将所有的“距离”字段的值加 1。 (2) 对修改后的 RIP 报文中的每一个项目,重复以下步骤: 若项目中的目的网络不在路由表中,则将该项目加到路由表中。 否则 若下一跳字段给出的路由器地址是同样的,则将收到的项 目 替换原路由表中的项目。 若收到项目中的距离小于路由表中的距离,则进行更新, 否则,什么也不做。 (3) 若 3 分钟还没有收到相邻路由器的更新路由表,则将此相邻路 由器记为不可达的路由器,即将距离置为16(距离为16表 示不可达)。 (4) 返回。

147 路由器之间交换信息 RIP协议让互联网中的所有路由器都和自己的相邻路由器不断交换路由信息,并不断更新其路由表,使得从每一个路由器到每一个目的网络的路由都是最短的(即跳数最少)。 虽然所有的路由器最终都拥有了整个自治系统的全局路由信息,但由于每一个路由器的位置不同,它们的路由表当然也应当是不同的。

148 一开始,各路由表只有到相邻路由器的信息 “”表示“直接交付” “4”表示“从本路由器到网 4” “1”表示“距离是 1” 1 1 
1 1  5 1  E 网 1 1 1  2 1  3 1  网 5 5 1  6 1  2 1  5 1  D 网 2 A 4 1  6 1  F 网 6 B 网 3 网 4 C 3 1  4 1  “”表示“直接交付” “4”表示“从本路由器到网 4” “1”表示“距离是 1”

149 路由器 B 收到相邻路由器 A 和 C 的路由表 A 说:“我到网 1 的距离是 1。” 因此 B 现在也可以到网 1,
1 1  5 1  E 1 1  2 1  3 1  网 1 1 1  2 1  3 1  网 5 5 1  6 1  2 1  5 1  D 网 2 A 4 1  6 1  4 1  6 1  F 网 6 B 网 3 网 4 C 3 1  4 1  更新后 A 说:“我到网 1 的距离是 1。” 因此 B 现在也可以到网 1, 距离是 2,经过 A。” 1 2 A 2 2 A 3 1  4 1  6 2 C

150 路由器 B 收到相邻路由器 A 和 C 的路由表 A 说:“我到网 2 的距离是 1。” 因此 B 现在也可以到网 2,
1 1  5 1  E 网 1 1 1  2 1  3 1  网 5 5 1  6 1  2 1  5 1  D 网 2 A 4 1  6 1  F 网 6 B 网 3 1 1  2 1  3 1  网 4 4 1  6 1  C 3 1  4 1  更新后 A 说:“我到网 2 的距离是 1。” 因此 B 现在也可以到网 2, 距离是 2,经过 A。” 1 2 A 2 2 A 3 1  4 1  6 2 C

151 路由器 B 收到相邻路由器 A 和 C 的路由表 A 说:“我到网 3 的距离是 1。” 但 B 没有必要绕道经过路由器 A
1 1  5 1  E 网 1 1 1  2 1  3 1  网 5 5 1  6 1  2 1  5 1  D 网 2 A 4 1  6 1  F 网 6 B 网 3 1 1  2 1  3 1  网 4 3 1  4 1  4 1  6 1  C 更新后 A 说:“我到网 3 的距离是 1。” 但 B 没有必要绕道经过路由器 A 再到达网 3,因此这一项目不变。 1 2 A 2 2 A 3 1  4 1  6 2 C

152 路由器 B 收到相邻路由器 A 和 C 的路由表 C 说:“我到网 4 的距离是 1。” 但 B 没有必要绕道经过路由器 C
1 1  5 1  E 网 1 1 1  2 1  3 1  网 5 5 1  6 1  2 1  5 1  D 网 2 A 4 1  6 1  F 网 6 B 网 3 1 1  2 1  3 1  网 4 3 1  4 1  4 1  6 1  C 更新后 C 说:“我到网 4 的距离是 1。” 但 B 没有必要绕道经过路由器 C 再到达网 4,因此这一项目不变。 1 2 A 2 2 A 3 1  4 1  6 2 C

153 路由器 B 收到相邻路由器 A 和 C 的路由表 C 说:“我到网 6 的距离是 1。” 因此 B 现在也可以到网 6,
1 1  5 1  E 网 1 1 1  2 1  3 1  网 5 5 1  6 1  2 1  5 1  D 网 2 A 4 1  6 1  F 网 6 B 网 3 1 1  2 1  3 1  网 4 3 1  4 1  4 1  6 1  C 更新后 C 说:“我到网 6 的距离是 1。” 因此 B 现在也可以到网 6, 距离是 2,经过 C。” 1 2 A 2 2 A 3 1  4 1  6 2 C

154 最终所有的路由器的路由表都更新了 1 1  2 1  3 1  4 2 B 5 2 E 6 3 B 1 1  2 2 A 3 2 A
1 1  2 1  3 1  4 2 B 5 2 E 6 3 B 1 1  2 2 A 3 2 A 4 3 A 5 1  6 2 F 1 2 E 2 2 D 3 3 C 4 2 C 5 1  6 1  E 网 1 网 5 1 2 A 2 1  3 2 A 4 3 A 5 1  6 2 F 网 2 D A F C 网 6 1 2 A 2 2 A 3 1  4 1  5 3 C 6 2 C 1 3 B 2 3 B 3 2 B 4 1  5 2 F 6 1  网 3 B 网 4

155 RIP 协议的位置 RIP 协议使用运输层的用户数据报 UDP进行传送(使用 UDP 的端口 520)。
因此 RIP 协议的位置应当在应用层。但转发 IP 数据报的过程是在网络层完成的。

156 3. RIP2 协议的报文格式 4 字节 地址族标识符 路由标记 4 字节 网络地址 命令 版本 子网掩码 必为 0 下一跳路由器地址
距离 (1-16) 首部 路由部分 路由信息 (20 字节/路由) 可重复出现 最多 25 个 RIP 报文 IP 首部 UDP 首部 UDP 用户数据报 IP 数据报

157 RIP2 的报文 由首部和路由部分组成。 RIP2 报文中的路由部分由若干个路由信息组成。每个路由信息需要用 20 个字节。地址族标识符(又称为地址类别)字段用来标志所使用的地址协议。 路由标记填入自治系统的号码,这是考虑使RIP 有可能收到本自治系统以外的路由选择信息。再后面指出某个网络地址、该网络的子网掩码、下一跳路由器地址以及到此网络的距离。

158 RIP 协议的优缺点 RIP 存在的一个问题是当网络出现故障时,要经过比较长的时间才能将此信息传送到所有的路由器。
路由器之间交换的路由信息是路由器中的完整路由表,因而随着网络规模的扩大,开销也就增加。

159 “”表示“直接交付” “1”表示“从本路由器到网 1” “1”表示“距离是 1” R1 说:“我到网 1 的距离是 1,是直接交付。” 正
1 1  网 1 网 2 1 2 R1 网 3 R1 R2 “”表示“直接交付” “1”表示“从本路由器到网 1” “1”表示“距离是 1” R1 说:“我到网 1 的距离是 1,是直接交付。”

160 “R1”表示 “1”表示“从本路由器到网 1” 经过 R1 “2”表示“距离是 2” R2 说:“我到网 1 的距离是 2,是经过 R1。”
1 1  网 1 网 2 1 2 R1 网 3 R1 R2 “R1”表示 经过 R1 “1”表示“从本路由器到网 1” “2”表示“距离是 2” R2 说:“我到网 1 的距离是 2,是经过 R1。”

161 R1 说:“我到网 1 的距离是 16 (表示无法到达), 是直接交付。”
1 1  网 1 网 2 1 2 R1 网 3 R1 R2 R2 R1 网 1 网 3 网 2 网 1出了故障 1 2 R1 R1 说:“我到网 1 的距离是 16 (表示无法到达), 是直接交付。” 但 R2 在收到 R1 的更新报文之前,还发送原来的报文, 因为这时 R2 并不知道 R1 出了故障。

162 1 1  网 1 网 2 1 2 R1 网 3 R1 R2 R2 R1 网 1 网 3 网 2 网 1出了故障 1 2 R1 1 3 R2 R1 收到 R2 的更新报文后,误认为可经过 R2 到达网1,于是更新自己的路由表,说:“我到网 1 的距离是 3,下一跳经过 R2”。然后将此更新信息发送给 R2。

163 R2 以后又更新自己的路由表为“1, 4, R1”,表明 “我到网 1 距离是 4,下一跳经过 R1”。
1 1  网 1 网 2 1 2 R1 网 3 R1 R2 R2 R1 网 1 网 3 网 2 网 1出了故障 1 2 R1 1 3 R2 1 4 R1 R2 以后又更新自己的路由表为“1, 4, R1”,表明 “我到网 1 距离是 4,下一跳经过 R1”。

164 这就是好消息传播得快,而坏消息传播得慢。网络出故障的传播时间往往需要较长的时间(例如数分钟)。这是 RIP 的一个主要缺点。
这就是好消息传播得快,而坏消息传播得慢。网络出故障的传播时间往往需要较长的时间(例如数分钟)。这是 RIP 的一个主要缺点。 1 1  网 1 网 2 1 2 R1 网 3 R1 R2 网 1 网 2 网 3 R1 R2 网 1出了故障 1 2 R1 1 3 R2 1 4 R1 1 5 R2 R2 R1 这样不断更新下去,直到 R1 和 R2 到网 1 的距离都增大到 16 时,R1 和 R2 才知道网1是不可达的。

165 6.5.3 内部网关协议 OSPF (Open Shortest Path First)
“最短路径优先”是因为使用了 Dijkstra 提出的最短路径算法SPF OSPF 只是一个协议的名字,它并不表示其他的路由选择协议不是“最短路径优先”。 是分布式的链路状态协议。

166 三个要点 向本自治系统中所有路由器发送信息,这里使用的方法是洪泛法。
发送的信息就是与本路由器相邻的所有路由器的链路状态,但这只是路由器所知道的部分信息。 “链路状态”就是说明本路由器都和哪些路由器相邻,以及该链路的“度量”(metric)。 只有当链路状态发生变化时,路由器才用洪泛法向所有路由器发送此信息。

167 链路状态数据库 (link-state database)
由于各路由器之间频繁地交换链路状态信息,因此所有的路由器最终都能建立一个链路状态数据库。 这个数据库实际上就是全网的拓扑结构图,它在全网范围内是一致的(这称为链路状态数据库的同步)。 OSPF 的链路状态数据库能较快地进行更新,使各个路由器能及时更新其路由表。OSPF 的更新过程收敛得快是其重要优点。

168 OSPF 的区域(area) 为了使 OSPF 能够用于规模很大的网络,OSPF 将一个自治系统再划分为若干个更小的范围,叫作区域。
每一个区域都有一个 32 bit 的区域标识符(用点分十进制表示)。 区域也不能太大,在一个区域内的路由器最好不超过 200 个。

169 OSPF 划分为两种不同的区域 至其他自治系统 自治系统 AS 主干区域 0.0.0.0 区域 0.0.0.1 区域 0.0.0.3
R1 R6 网 6 R3 R7 网 1 R5 R9 网 7 网 2 R4 R2 网 3 网 8 R8 网 4 网 5 区域 区域 区域

170 划分区域 划分区域的好处就是将利用洪泛法交换链路状态信息的范围局限于每一个区域而不是整个的自治系统,这就减少了整个网络上的通信量。
在一个区域内部的路由器只知道本区域的完整网络拓扑,而不知道其他区域的网络拓扑的情况。 OSPF 使用层次结构的区域划分。在上层的区域叫作主干区域(backbone area)。主干区域的标识符规定为 。主干区域的作用是用来连通其他在下层的区域。

171 主干路由器 至其他自治系统 自治系统 AS 主干区域 0.0.0.0 区域 0.0.0.1 区域 0.0.0.3 区域 0.0.0.2 R1
网 6 R3 R7 网 1 R5 R9 网 7 网 2 R4 R2 网 3 网 8 R8 网 4 网 5 区域 区域 区域

172 区域边界路由器 至其他自治系统 自治系统 AS 主干区域 0.0.0.0 区域 0.0.0.1 区域 0.0.0.3 区域 0.0.0.2
R1 R6 网 6 R3 R7 网 1 R5 R9 网 7 网 2 R4 R2 网 3 网 8 R8 网 4 网 5 区域 区域 区域

173 OSPF 直接用 IP 数据报传送 OSPF 不用 UDP 而是直接用 IP 数据报传送,可见 OSPF 的位置在网络层。
数据报很短的另一好处是可以不必将长的数据报分片传送。分片传送的数据报只要丢失一个,就无法组装成原来的数据报,而整个数据报就必须重传。

174 OSPF 的其他特点 OSPF 对不同的链路可根据 IP 分组的不同服务类型 TOS 而设置成不同的代价。因此,OSPF 对于不同类型的业务可计算出不同的路由。 如果到同一个目的网络有多条相同代价的路径,那么可以将通信量分配给这几条路径。这叫作多路径间的负载平衡。 所有在 OSPF 路由器之间交换的分组都具有鉴别的功能。 支持可变长度的子网划分和无分类编址 CIDR。 每一个链路状态都带上一个 32 bit 的序号,序号越大状态就越新。

175 OSPF 分组 比特 8 16 31 版 本 类 型 分 组 长 度 路 由 器 标 识 符 区 域 标 识 符 检 验 和 鉴 别 类 型
8 16 31 版 本 类 型 分 组 长 度 路 由 器 标 识 符 区 域 标 识 符 检 验 和 鉴 别 类 型 鉴 别 鉴 别 24 字节 OSPF 分组首部 类型 1 至类型 5 的 OSPF 分组 IP数据报首部 OSPF 分组 IP 数据报

176 2. OSPF 的五种分组类型 类型1,问候(Hello)分组。 类型2,数据库描述(Database Description)分组。
类型3,链路状态请求(Link State Request)分组。 类型4,链路状态更新(Link State Update)分组, 用洪泛法对全网更新链路状态。 类型5,链路状态确认(Link State Acknowledgment) 分组。

177 OSPF的基本操作 问候 确定可达性 问候 数据库描述 数据库描述 达到数据库的同步 数据库描述 数据库描述 链路状态请求 新情况下的同步
链路状态更新 链路状态确认

178 OSPF 使用的是可靠的洪泛法 t1 t2 t3 t4 更新报文 R R R ACK报文 t R

179 OSPF 的其他特点 OSPF 还规定每隔一段时间,如 30 分钟,要刷新一次数据库中的链路状态。
由于一个路由器的链路状态只涉及到与相邻路由器的连通状态,因而与整个互联网的规模并无直接关系。因此当互联网规模很大时,OSPF 协议要比距离向量协议 RIP 好得多。 OSPF 没有“坏消息传播得慢”的问题,据统计,其响应网络变化的时间小于 100 ms。

180 指定的路由器 (designated router)
多点接入的局域网采用了指定的路由器的方法,使广播的信息量大大减少。 指定的路由器代表该局域网上所有的链路向连接到该网络上的各路由器发送状态信息。

181 OSPF 支持三种网络的连接 (1) 两个路由器之间的点对点连接 (2) 具有广播功能的局域网 (3) 无广播功能的广域网

182 (a) 网络拓扑 广域网 W4 广域网 W1 广域网 W6 5 12 10 D E B 4 7 8 A 广域网 W2 H 4 I 2 3 8
13 F 局域网 L1 2 G 3 3 2 C 16 12 6 广域网 W5 局域网 L2 广域网 W3 (a) 网络拓扑 W1 W4 B D 12 10 H 4 E 8 W6 5 7 W2 A 4 8 7 2 3 13 3 4 8 3 I F G L1 12 L2 2 2 6 W5 16 C W3 (b) 有向图

183 以路由器F为根的最短路径树 W1 有向图 W4 B D 12 10 H 4 E 8 W6 5 7 W2 A 4 8 7 2 3 13 3 4
I F G L1 12 L2 2 2 6 W5 16 C W3 以路由器F为根的最短路径树 W1 W4 12 B D E W6 W2 5 4 7 8 A 3 8 4 I F L2 G 3 L1 16 6 W5 W3

184 6.5.4 外部网关协议 BGP BGP 是不同自治系统的路由器之间交换路由信息的协议。
BGP 的较新版本是 1995 年发表的 BGP-4(BGP 的第 4 个版本)。 可以将 BGP-4 简写为 BGP。

185 BGP 使用的环境却不同 因特网的规模太大,使得自治系统之间路由选择非常困难。 对于自治系统之间的路由选择,要寻找最佳路由是很不现实的。
自治系统之间的路由选择必须考虑有关策略。 因此,边界网关协议 BGP 只能是力求寻找一条能够到达目的网络且比较好的路由(不能兜圈子),而并非要寻找一条最佳路由。

186 BGP 发言人 每一个自治系统的管理员要选择至少一个路由器作为该自治系统的“BGP 发言人” 。
一般说来,两个 BGP 发言人都是通过一个共享网络连接在一起的,而 BGP 发言人往往就是 BGP 边界路由器,但也可以不是 BGP 边界路由器。

187 BGP 交换路由信息 一个 BGP 发言人与其他自治系统中的 BGP 发言人要交换路由信息,就要先建立 TCP 连接,然后在此连接上交换 BGP 报文以建立 BGP 会话(session),利用 BGP 会话交换路由信息。 使用 TCP 连接能提供可靠的服务,也简化了路由选择协议。 使用 TCP 连接交换路由信息的两个 BGP 发言人,彼此成为对方的邻站或对等站。

188 BGP 发言人和 自治系统 AS 的关系 BGP BGP 发言人 AS1 发言人 AS2 BGP 发言人 BGP 发言人 AS3

189 自治系统连通图 BGP 发言人互相交换网络可达性的信息后,各 BGP 发言人就可找出到达各自治系统的比较好的路由。 AS2 AS1 AS3

190 BGP 发言人交换路径向量 自治系统 AS2 的 BGP 发言人通知主干网的 BGP 发言人:“要到达网络 N1, N2, N3 和 N4 可经过 AS2。” 本地 ISP(AS4) N1, N2 本地 ISP(AS5) N3, N4 地区 ISP (AS2) 主干网 (AS1) 本地 ISP(AS6) N5 地区 ISP (AS3) 本地 ISP(AS7) N6, N7

191 BGP 发言人交换路径向量 主干网还可发出通知:“要到达网络 N5, N6 和 N7 可沿路径(AS1, AS3)。”
本地 ISP(AS4) N1, N2 地区 ISP (AS2) 本地 ISP(AS5) N3, N4 主干网 (AS1) 本地 ISP(AS6) N5 本地 ISP(AS7) N6, N7 地区 ISP (AS3)

192 BGP 协议的特点 BGP 协议交换路由信息的结点数量级是自治系统数的量级,这要比这些自治系统中的网络数少很多。

193 BGP 协议的特点 BGP 支持 CIDR,因此 BGP 的路由表也就应当包括目的网络前缀、下一跳路由器,以及到达该目的网络所要经过的各个自治系统序列。 在BGP 刚刚运行时,BGP 的邻站是交换整个的 BGP 路由表。但以后只需要在发生变化时更新有变化的部分。这样做对节省网络带宽和减少路由器的处理开销方面都有好处。

194 BGP-4 共使用四种报文 (1) 打开(Open)报文,用来与相邻的另一个BGP发言人建立关系。
(2) 更新(Update)报文,用来发送某一路由的信息,以及列出要撤消的多条路由。 (3) 保活(Keepalive)报文,用来确认打开报文和周期性地证实邻站关系。 (3) 通知(Notificaton)报文,用来发送检测到的差错。

195 BGP 报文的格式 4 字节 标 记 首部长度 19 字节 长 度 类 型 BGP 报文的数据部分 可变长度

196 6.6 IP 多播和因特网组管理协议 IGMP 6.6.1 IP 多播的基本概念
多播可明显地减少网络中资源的消耗。 R4 R3 D C A 多播组 G 复制 B R1 X R2 复制 R5 R6

197 IP 多播的一些特点 (1) 多播使用组地址—— IP 使用 D 类地址支持多播。多播地址只能用于目的地址,而不能用于源地址。
(2) 永久组地址——由因特网号码指派管理局 IANA 负责指派。 (3) 动态的组成员 (4) 使用硬件进行多播

198 D 类 IP 地址 与以太网多播地址的映射关系 8 16 24 31 1110 0 1 0 0 5 E 00000001 00000000
在多播主机组标识符中的 5 bit 不能用来构成以太网地址 8 16 24 31 D 类 IP 地址 1110 多播主机组标识符的低 23 bit 复制到以太网地址中 E 48 bit 以太网地址 目的地址的第 1 字节中的 最低位比特置 1 表示多播

199 6.6.2 因特网组管理协议 IGMP (Internet Group Management Protocol)
IGMP 使用 IP 数据报传递其报文(即 IGMP 报文加上 IP 首部构成 IP 数据报),但它也向 IP 提供服务。 不把 IGMP 看成是一个单独的协议,而是属于整个网际协议 IP 的一个组成部分。

200 IGMP 可分为两个阶段 第一阶段:当某个主机加入新的多播组时,该主机应向多播组的多播地址发送IGMP 报文,声明自己要成为该组的成员。本地的多播路由器收到 IGMP 报文后,将组成员关系转发给因特网上的其他多播路由器。

201 IGMP 可分为两个阶段 第二阶段:因为组成员关系是动态的,因此本地多播路由器要周期性地探询本地局域网上的主机,以便知道这些主机是否还继续是组的成员。 只要对某个组有一个主机响应,那么多播路由器就认为这个组是活跃的。 但一个组在经过几次的探询后仍然没有一个主机响应,则不再将该组的成员关系转发给其他的多播路由器。

202 主机在多播中的几种状态 其他主机响应 / 取消计时器 加入组 / 启动计时器 计时器时间到 / 发送响应 NON- MEMBER
DELAYING MEMBER MEMBER 离开组 / 取消计时器 询问到达 / 启动计时器 参照计数器的值变为零 / 离开组

203 IGMP 的报文格式 比特 8 16 31 类 型 响 应 时 间 检 验 和 组地址(询问时为零) IP数据报首部 IGMP 报文
8 16 31 类 型 响 应 时 间 检 验 和 组地址(询问时为零) IP数据报首部 IGMP 报文 IP 数据报

204 多播路由选择 多播路由选择相当复杂 (1) 即使网络拓扑不发生变化,但由于某个应用程序加入或离开了一个多播组,多播路由都会发生变化。 (2) 多播转发要求路由器不仅要检查目的地址,而且还要检查源地址,以便确定何时需要复制多播数据报和转发多播数据报副本。 (3) 多播数据报可以由不是多播组成员的主机产生,并且可能通过没有任何组成员的网络。

205 隧道技术(tunneling) 网 1 (支持多播) 网 2 (支持多播) 不支持多播 的网络 R1 R2 隧道 多播数据报 首部 数 据
数 据 网 1 和网 2 中的多播数据报 首部 数 据 隧道中通行的单播 IP 数据报 单播 IP 数据报

206 几种多播路由选择协议 距离向量多播路由选择协议 DVMRP (Distance Vector Multicast Routing Protocol) 核心基干树 CBT (Core Based Tree) 开放最短通路优先的多播扩展 MOSPF (Multicast Extensions to OSPF) 协议无关多播-稀疏方式 PIM-SM (Protocol Independent Multicast-Sparse Mode) 协议无关多播-密集方式 PIM-DM (Protocol Independent Multicast-Dense Mode)

207 6.7 虚拟专用网 VPN 和网络地址转换 NAT 6.7.1 虚拟专用网 VPN
本地地址——仅在机构内部使用的 IP 地址,可以由本机构自行分配,而不需要向因特网的管理机构申请。 全球地址——全球惟一的IP地址,必须向因特网的管理机构申请。

208 [RFC 1918]指明的专用地址(private address)
这些地址只能用于一个机构的内部通信,而不能用于和因特网上的主机通信。 专用地址只能用作本地地址而不能用作全球地址。在因特网中的所有路由器对目的地址是专用地址的数据报一律不进行转发。

209 用隧道技术实现虚拟专用网 本地地址 全球地址 本地地址 125.1.2.3 隧道 194.4.5.6 部门 B Y X 部门 A R2 R1
X 隧道 部门 B 部门 A R2 R1 因特网 使用隧道技术

210 用隧道技术实现虚拟专用网 加密的从 X 到 Y 的内部数据报 源地址:125.1.2.3 目的地址:194.4.5.6 外部数据报的数据部分
数据报首部 Y X 隧道 部门 B 部门 A R2 R1 因特网 使用隧道技术 部门 A 部门 B X Y R1 R2 虚拟专用网 VPN

211 内联网 Intranet 和外联网 Extranet (都是基于TCP/IP协议)
由部门 A 和 B 的内部网络所构成的虚拟专用网 VPN 又称为内联网(Intranet),表示部门 A 和 B 都是在同一个机构的内部。 一个机构和某些外部机构共同建立的虚拟专用网 VPN 又称为外联网(Extranet)。 部门 A 部门 B X Y R1 R2 虚拟专用网 VPN

212 6.7.2 网络地址转换 NAT (Network Address Translation)
需要在专用网连接到因特网的路由器上安装 NAT 软件。装有 NAT 软件的路由器叫做 NAT路由器,它至少有一个有效的外部全球地址 IPG。 所有使用本地地址的主机在和外界通信时都要在 NAT 路由器上将其本地地址转换成 IPG 才能和因特网连接。

213 网络地址转换的过程 内部主机 X 用本地地址 IPX 和因特网上主机 Y 通信所发送的数据报必须经过 NAT 路由器。
NAT 路由器将数据报的源地址 IPX 转换成全球地址 IPG,但目的地址 IPY 保持不变,然后发送到因特网。 NAT 路由器收到主机 Y 发回的数据报时,知道数据报中的源地址是 IPY 而目的地址是 IPG。 根据 NAT 转换表,NAT 路由器将目的地址 IPG 转换为 IPX,转发给最终的内部主机 X。

214 6.8 下一代的网际协议 IPv6 (IPng) 6.8.1 解决 IP 地址耗尽的措施
最主要的问题就是 32 bit 的 IP 地址不够用。 要解决 IP 地址耗尽的问题的措施: 采用无类别编址 CIDR,使 IP 地址的分配更加合理。 采用网络地址转换 NAT方法以节省全球 IP 地址。 采用具有更大地址空间的新版本的 IP 协议 IPv6。

215 6.8.2 IPv6 的基本首部 IPv6 所引进的主要变化如下
更大的地址空间。IPv6 将地址从 IPv4 的 32 bit 增大到了 128 bit, 扩展的地址层次结构。 灵活的首部格式。 改进的选项。 允许协议继续扩充。 支持即插即用(即自动配置) 支持资源的预分配。

216 IPv6 数据报的首部 IPv6 将首部长度变为固定的 40 字节,称为基本首部(base header)。
将不必要的功能取消了,首部的字段数减少到只有 8 个。 取消了首部的检验和字段,加快了路由器处理数据报的速度。 在基本首部的后面允许有零个或多个扩展首部。 所有的扩展首部和数据合起来叫做数据报的有效载荷(payload)或净负荷。

217 IPv6 数据报的一般形式 有效载荷 选项 基本 首部 扩展 首部 1 扩展 首部 N 数 据 部 分 IPv6 数据报

218 IPv6 数据报首部与 IPv4 数据报首部的对比
有变化 取消 比特 4 8 16 19 24 31 版 本 首部长度 服 务 类 型 总 长 度 20 字节 标 识 标志 片 偏 移 生 存 时 间 协 议 首 部 检 验 和 IPv4 首部 源 地 址 目 的 地 址 可变 部分 可 选 字 段 (长 度 可 变) 填 充 上面是 IPv4 数据报的首部

219 比特 4 12 16 24 31 版 本 通 信 量 类 流 标 号 有 效 载 荷 长 度 下 一 个 首 部 跳 数 限 制 源 地 址 IPv6 的 基本首部 (40 B) (128 bit) 目 的 地 址 (128 bit) 扩展首部 / 数据 IPv6 的 有效载荷 (至 64 KB)

220 比特 4 12 16 24 31 版 本 通 信 量 类 流 标 号 有 效 载 荷 长 度 下 一 个 首 部 跳 数 限 制 源 地 址 IPv6 的 基本首部 (40 B) (128 bit) 目 的 地 址 (128 bit) 扩展首部 / 数据 IPv6 的 有效载荷 (至 64 KB)

221 版本(version)—— 4 bit。它指明了协议的版本,对 IPv6 该字段总是 6。
比特 4 12 16 24 31 版 本 通 信 量 类 流 标 号 有 效 载 荷 长 度 下 一 个 首 部 跳 数 限 制 IPv6 40 B 源 地 址 (128 bit) 目 的 地 址 (128 bit) 版本(version)—— 4 bit。它指明了协议的版本,对 IPv6 该字段总是 6。

222 比特 4 12 16 24 31 版 本 通 信 量 类 流 标 号 有 效 载 荷 长 度 下 一 个 首 部 跳 数 限 制 IPv6 40 B 源 地 址 (128 bit) 目 的 地 址 (128 bit) 通信量类(traffic class)—— 8 bit。这是为了区分不同的 IPv6 数据报的类别或优先级。目前正在进行不同的通信量类性能的实验。

223 所有属于同一个流的数据报都具有同样的流标号。
比特 4 12 16 24 31 版 本 通 信 量 类 流 标 号 有 效 载 荷 长 度 下 一 个 首 部 跳 数 限 制 IPv6 40 B 源 地 址 (128 bit) 目 的 地 址 (128 bit) 流标号(flow label)—— 20 bit。 “流”是互联网络上从特定源点到特定终点的一系列数据报, “流”所经过的路径上的路由器都保证指明的服务质量。 所有属于同一个流的数据报都具有同样的流标号。

224 比特 4 12 16 24 31 版 本 通 信 量 类 流 标 号 有 效 载 荷 长 度 下 一 个 首 部 跳 数 限 制 IPv6 40 B 源 地 址 (128 bit) 目 的 地 址 (128 bit) 有效载荷长度(payload length)—— 16 bit。它指明 IPv6 数据报除基本首部以外的字节数(所有扩展首部都算在有效载荷之内),其最大值是 64 KB。

225 下一个首部(next header)—— 8 bit。它相当于 IPv4 的协议字段或可选字段。
比特 4 12 16 24 31 版 本 通 信 量 类 流 标 号 有 效 载 荷 长 度 下 一 个 首 部 跳 数 限 制 IPv6 40 B 源 地 址 (128 bit) 目 的 地 址 (128 bit) 下一个首部(next header)—— 8 bit。它相当于 IPv4 的协议字段或可选字段。

226 跳数限制(hop limit)—— 8 bit。源站在数据报发出时即设定跳数限制。路由器在转发数据报时将跳数限制字段中的值减1。
比特 4 12 16 24 31 版 本 通 信 量 类 流 标 号 有 效 载 荷 长 度 下 一 个 首 部 跳 数 限 制 IPv6 40 B 源 地 址 (128 bit) 目 的 地 址 (128 bit) 跳数限制(hop limit)—— 8 bit。源站在数据报发出时即设定跳数限制。路由器在转发数据报时将跳数限制字段中的值减1。 当跳数限制的值为零时,就要将此数据报丢弃。

227 源地址—— 128 bit。是数据报的发送站的 IP 地址。
比特 4 12 16 24 31 版 本 通 信 量 类 流 标 号 有 效 载 荷 长 度 下 一 个 首 部 跳 数 限 制 IPv6 40 B 源 地 址 (128 bit) 目 的 地 址 (128 bit) 源地址—— 128 bit。是数据报的发送站的 IP 地址。

228 目的地址—— 128 bit。是数据报的接收站的 IP 地址。
比特 4 12 16 24 31 版 本 通 信 量 类 流 标 号 有 效 载 荷 长 度 下 一 个 首 部 跳 数 限 制 IPv6 40 B 源 地 址 (128 bit) 目 的 地 址 (128 bit) 目的地址—— 128 bit。是数据报的接收站的 IP 地址。

229 6.8.3 IPv6 的扩展首部 1. 扩展首部及下一个首部字段
IPv6 将原来 IPv4 首部中选项的功能都放在扩展首部中,并将扩展首部留给路径两端的源站和目的站的主机来处理。 数据报途中经过的路由器都不处理这些扩展首部(只有一个首部例外,即逐跳选项扩展首部)。 这样就大大提高了路由器的处理效率。

230 六种扩展首部 在[RFC 2460]中定义了六种扩展首部: 逐跳选项 路由选择 分片 鉴别 封装安全有效载荷 目的站选项

231 IPv6 的扩展首部 无扩展首部 有扩展首部 基本首部 下一个首部 = TCP/UDP TCP/UDP 首部 和数据
有效载荷 有扩展首部 基本首部 下一个首部 = 路由选择 路由选择首部 下一个首部 = 分片 分片首部 下一个首部 = TCP/UDP TCP/UDP 首部 和数据 (TCP/UDP 报文段) 有效载荷

232 2. 扩展首部举例 IPv6 将分片限制为由源站来完成。源站可以采用保证的最小 MTU(1280字节),或者在发送数据前完成路径最大传送单元发现(Path MTU Discovery),以确定沿着该路径到目的站的最小 MTU。 分片扩展首部的格式如下: 比特 8 16 29 31 下 一 个 首 部 保 留 片 偏 移 保 留 M 标 识 符

233 扩展首部举例 IPv6 数据报的有效载荷长度为 3000 字节。下层的以太网的最大传送单元 MTU 是 1500 字节。
分成三个数据报片,两个 1400 字节长,最后一个是 200 字节长。 扩展首部 IPv6 基本首部 分片首部 1 第 一 个 分 片 1400 字节 IPv6 基本首部 分片首部 2 第 二 个 分 片 1400 字节 IPv6 基本首部 分片首部 3 第三个分片 200 字节

234 用隧道技术来传送长数据报 当路径途中的路由器需要对数据报进行分片时,就创建一个全新的数据报,然后将这个新的数据报分片,并在各个数据报片中插入扩展首部和新的基本首部。 路由器将每个数据报片发送给最终的目的站,而在目的站将收到的各个数据报片收集起来,组装成原来的数据报,再从中抽取出数据部分。

235 用隧道技术将一个 IPv6 数据报 分成 3 个数据报片
基本首部 有 效 载 荷 F1 F2 F3 新的 基本首部 F1 分片 1 扩展首部 新的 基本首部 分片 2 扩展首部 F2 新的 基本首部 F3 分片 3 扩展首部

236 6.8.4 IPv6 的地址空间 1. 128 bit 的地址空间 IPv6 数据报的目的地址可以是以下三种基本类型地址之一:
(1) 单播(unicast) 单播就是传统的点对点通信。 (2) 多播(multicast) 多播是一点对多点的通信。 (3) 任播(anycast) 这是 IPv6 增加的一种类型。任播的目的站是一组计算机,但数据报在交付时只交付给其中的一个,通常是距离最近的一个。

237 结点与接口 IPv6 将实现 IPv6 的主机和路由器均称为结点。 IPv6 地址是分配给结点上面的接口。 一个接口可以有多个单播地址。
一个结点接口的单播地址可用来惟一地标志该结点。

238 冒号十六进制记法 (colon hexadecimal notation)
每个 16 bit 的值用十六进制值表示,各值之间用冒号分隔。 68E6:8C64:FFFF:FFFF:0:1180:960A:FFFF 零压缩(zero compression),即一连串连续的零可以为一对冒号所取代。 FF05:0:0:0:0:0:0:B3 可以写成: FF05::B3

239 点分十进制记法的后缀 0:0:0:0:0:0:128.10.2.1 再使用零压缩即可得出: ::128.10.2.1
再使用零压缩即可得出: :: CIDR 的斜线表示法仍然可用。 60 bit的前缀 12AB CD3 可记为: 12AB:0000:0000:CD30:0000:0000:0000:0000/60 或12AB::CD30:0:0:0:0/60 或12AB:0:0:CD30::/60

240 2. 地址空间的分配 IPv6 将 128 bit 地址空间分为两大部分。 第一部分是可变长度的类型前缀,它定义了地址的目的。
2. 地址空间的分配 IPv6 将 128 bit 地址空间分为两大部分。 第一部分是可变长度的类型前缀,它定义了地址的目的。 第二部分是地址的其余部分,其长度也是可变的。 128 bit 长度可变 长度可变 类型前缀 地址的其他部分

241 前缀为 的地址 前缀为 是保留一小部分地址与 IPv4 兼容的,这是因为必须要考虑到在比较长的时期 IPv 4和 IPv6 将会同时存在,而有的结点不支持 IPv6。 因此数据报在这两类结点之间转发时,就必须进行地址的转换。 IPv4 兼容的 IPv6 地址 IPv4 地址 IPv4 映射的 IPv6 地址 FFFF IPv4 地址 比特数

242 IPv6 单播地址的等级结构 IPv6 扩展了地址的分级概念,使用以下三个等级: (1) 第一级(顶级),指明全球都知道的公共拓扑。
(2) 第二级(地点级),指明单个的地点。 (3) 第三级,指明单个的网络接口。 比特数 TLA 标识符 P 保留 NLA 标识符 SLA 标识符 接口标识符 顶级 地点级 第三级

243 第三级地址 IPv6 地址的最低的第三级对应于计算机和网络的单个接口。
IPv6 地址的后缀有 64 bi t之多,它足够大,因而可以将各种接口的硬件地址直接进行编码。 IPv6 使用邻站发现协议使结点能够确定哪些计算机是和它相邻接的。 比特数 TLA 标识符 P 保留 NLA 标识符 SLA 标识符 接口标识符 顶级 地点级 第三级

244 EUI-64 IEEE定 义了一个标准的 64 bit 全球惟一地址格式 EUI-64。
EUI-64 的前三个字节(24 bit)仍为公司标识符,但后面的扩展标识符是五个字节(40 bit)。 较为复杂的是当需要将 48 bit 的以太网硬件地址转换为 IPv6 地址。

245 将以太网地址转换为 IPv6 地址 G/L 比特 I/G 比特 比特 0 8 24 47 IEEE 802 地址
比特 IEEE 802 地址 cccccc0gcccccccccccccccc 低位 24 bit 比特 接口 标识符 cccccc1gcccccccccccccccc 低位 24 bit 0xFFFE G/L 比特置 1

246 第二级地址 IPv6 地址中间的第二级对应于在一个地点的一组计算机和网络,它们通常是相距较近的且都归一个单位来管理。
SLA 级表示 Site Level Aggregation,即地点级聚合,它和 IPv4 中的子网字段相似。 比特数 TLA 标识符 P 保留 NLA 标识符 SLA 标识符 接口标识符 顶级 地点级 第三级

247 第一级地址(有四个字段 ) (1) P字段—— 3 bit,即格式前缀。
(2) 顶级聚合标识符 TLA ID——13 bit,指派给ISP 或拥有这些地址的汇接点(exchange)。 (3) 保留字段—— 8 bit。 (4) 下一级聚合标识符 NLA ID—— 16 bit。指派给一个特定的用户。 比特数 TLA 标识符 P 保留 NLA 标识符 SLA 标识符 接口标识符 顶级 地点级 第三级

248 6.8.5 从 IPv4 向 IPv6 过渡 向 IPv6 过渡只能采用逐步演进的办法,同时,还必须使新安装的 IPv6 系统能够向后兼容。
双协议栈(dual stack)是指在完全过渡到 IPv6 之前,使一部分主机(或路由器)装有两个协议栈,一个 IPv4 和一个 IPv6。

249 双协议栈 IPv4 IPv4/IPv6 双协议栈 IPv6 应用层 应用层 应用层 TCP 或 UDP TCP 或 UDP
数据链路层 物理层 数据链路层 物理层 数据链路层 物理层 和 IPv4 通信 和 IPv6 通信

250 用双协议栈进行 从 IPv4 到 IPv6 的过渡 … 双协议栈 IPv6/IPv4 IPv4 网络 双协议栈 IPv6/IPv4 IPv6
B C D E F A 流标号:X 源地址:A 目的地址:F …… 数据部分 源地址:A 目的地址:F …… 源地址:A 目的地址:F …… 流标号:无 源地址:A 目的地址:F …… 数据部分 数据部分 数据部分 IPv4 数据报 IPv6 数据报 IPv6 数据报

251 使用隧道技术从 IPv4 到 IPv6 过渡 双协议栈 IPv6/IPv4 双协议栈 IPv6/IPv4 IPv4 网络 IPv6 IPv6
A B E F 双协议栈 IPv6/IPv4 双协议栈 IPv6/IPv4 IPv6 IPv4 网络 IPv6 A B C D E F IPv4 网络 流标号:X 源地址:A 目的地址:F …… 数据部分 源地址:B 目的地址:E 源地址:B 目的地址:E 流标号:X 源地址:A 目的地址:F …… 数据部分 IPv6 数据报 IPv6 数据报 IPv6 数据报 IPv6 数据报 IPv4 数据报 IPv4 数据报

252 6.8.6 ICMPv6 ICMPv6 的报文格式和 IPv4 使用的 ICMP 的相似,即前4个字节的字段名称都是一样的。
差错报文(error message) 提供信息的报文(informational message 取消了使用得很少的 ICMP 报文


Download ppt "第 6 章 网络互连."

Similar presentations


Ads by Google