LTE承载网调测与故障排查 v1.0
课程内容 调试工具介绍 告警 状态查询 光路检测 Ping Trace 故障排查方法及案例
告警可理解为某种类型的网络故障或隐患,由软件根据学员的配置自动生成。 告警信息分两部分,分别是当前告警和历史告警。 告警界面 告警可理解为某种类型的网络故障或隐患,由软件根据学员的配置自动生成。 告警信息分两部分,分别是当前告警和历史告警。
告警 详细告警信息
状态查询提供对路由器、PTN、OTN的数据配置结果进行查询,并显示结果。 通过状态查询,可以发现可能的故障点。 状态查询界面 状态查询提供对路由器、PTN、OTN的数据配置结果进行查询,并显示结果。 通过状态查询,可以发现可能的故障点。
在路由器/PTN可查询,列出该设备所有物理接口的状态和配置。 状态查询 物理接口查询 在路由器/PTN可查询,列出该设备所有物理接口的状态和配置。
在PTN可查询,列出该设备所有VLAN及其关联的物理接口。 Untagged接口:表示此VLAN关联的这个接口是access模式。 状态查询 VLAN查询 在PTN可查询,列出该设备所有VLAN及其关联的物理接口。 Untagged接口:表示此VLAN关联的这个接口是access模式。 Tagged接口:表示此VLAN关联的这个接口是trunk模式。
在路由器/PTN可查询,列出该设备所有配置了IP地址的接口状态和配置。 状态查询 IP接口查询 在路由器/PTN可查询,列出该设备所有配置了IP地址的接口状态和配置。 路由器可配置IP地址的接口包括物理接口、loopback接口和子接口。PTN可配置IP地址的接口包括loopback接口和VLAN三层接口。
在路由器/PTN可查询,列出该设备所有路由。路由表中的路由遵循最长匹配原则。 状态查询 路由表查询 在路由器/PTN可查询,列出该设备所有路由。路由表中的路由遵循最长匹配原则。
在路由器/PTN可查询,列出该设备所有OSPF邻居。 状态查询 OSPF邻居查询 在路由器/PTN可查询,列出该设备所有OSPF邻居。
在OTN上可查询,列出本OTN的电交叉配置。 状态查询 电交叉配置查询 在OTN上可查询,列出本OTN的电交叉配置。
在OTN上可查询,列出本OTN的频率配置。 状态查询 频率配置查询 在OTN上可查询,列出本OTN的频率配置。
选中光路检测后,将鼠标移动到左侧设备图中某OTN上,会出现选择菜单。选择源和目的端口。
Ping是检测两个IP地址间能否互相通信的重要工具。 点击右侧工具点击Ping按钮,在屏幕左侧设备连接图中选择源、目的设备及IP地址。 在左下方的结果反馈框中,选择“执行”,即可完成一次Ping操作,并实时反馈ping的结果。
Trace用于跟踪从源IP到目的IP地址的转发路径,是判断路径中故障点的重要工具。 在左下方的结果反馈框中,选择“执行”,即可完成一次Trace操作,并实时反馈Trace的结果。
课程内容 调试工具介绍 故障排查方法及案例 故障排查方法 故障案例1 故障案例2
故障排查步骤 要对网络故障进行准确分析,首先应该了解故障的各种现象,然后才能确定可能产生这些现象的故障根源。 故障排查方法 故障排查步骤 要对网络故障进行准确分析,首先应该了解故障的各种现象,然后才能确定可能产生这些现象的故障根源。 信息包括在调试工具的“状态查询”中所能观察到的信息,还有Ping、Trace、光路检测等工具的测试结果。 利用收集到的信息,并根据故障处理经验和掌握的知识,来确定排错范围。通过划分范围,确定需要关注的故障或与故障情况相关的那一部分网络设备、传输介质或终端。 如果故障比较复杂,整理一张表格,列出各种可能原因,并针对每一种可能的原因制定出详细的操作排查步骤。 当实施操作计划时,应该注意,每次只能做一个修改。如果修改成功,那么修改的结果应该进行分析并记录。如果修改没有成功,应该立即撤消这个修改。 当一个故障排查方案没有解决故障时,进入到循环故障排查阶段。在进行下一个循环之前,必须将网络恢复到实施上一个方案前的状态。
万绿市中心机房RT1通过OTN与万绿市汇聚1区机房PTN1对接,二者启用OSPF,应该形成OSPF邻居关系。 故障案例1 网络拓扑 万绿市中心机房RT1通过OTN与万绿市汇聚1区机房PTN1对接,二者启用OSPF,应该形成OSPF邻居关系。
万绿市承载汇聚1区机房PTN1(以下简称PTN1与万绿市承载中心机房RT1(以下简称RT1无法形成OSPF邻居关系。 故障案例1 故障现象观察 万绿市承载汇聚1区机房PTN1(以下简称PTN1与万绿市承载中心机房RT1(以下简称RT1无法形成OSPF邻居关系。 在调测工具“状态查询”中,中查看PTN1的OSPF邻居,没有发现RT1的邻居条目。 故障信息采集
从PTN1上Ping RT1的OSPF接口地址,Ping不成功。 故障案例1 故障信息采集 从PTN1上Ping RT1的OSPF接口地址,Ping不成功。
由于PTN1与RT1形成OSPF的接口属于同一网段,分析可能是由于PTN1与RT1对接参数配置错误,或者是其间的线缆连接有误。 故障案例1 经验分析和理论判断 由于PTN1与RT1形成OSPF的接口属于同一网段,分析可能是由于PTN1与RT1对接参数配置错误,或者是其间的线缆连接有误。 整理可能的原因列表 两端接口IP地址或子网掩码不匹配; 两端接口VLAN配置不匹配; 两端接口间线缆连接有问题; 4. 两端接口间的OTN配置有错误。
对可能原因进行排错验证 检查两端接口IP地址配置。 PTN1的IP地址: RT1的IP地址: 检查结果:两端配置正确。可排除此原因。 故障案例1 对可能原因进行排错验证 检查两端接口IP地址配置。 PTN1的IP地址: RT1的IP地址: 检查结果:两端配置正确。可排除此原因。
PTN1的VLAN配置,为access模式。 故障案例1 对可能原因进行排错验证 检查两端接口VLAN配置。 PTN1的VLAN配置,为access模式。 RT1与PTN1对接为物理接口。 检查结果:两端配置正确。
使用光路检测工具,检测两端OTN客户侧接口间连线是否正确。 故障案例1 对可能原因进行排错验证 使用光路检测工具,检测两端OTN客户侧接口间连线是否正确。 检查结果:系统提示万绿市承载汇聚1区机房OTN的OMU单板频率不匹配。
检测万绿承载1区汇聚机房OTN的OMU10C单板的频率及连线。 故障案例1 对可能原因进行排错验证 检测万绿承载1区汇聚机房OTN的OMU10C单板的频率及连线。 检测万绿承载1区汇聚机房OTN连线,发现Slot32 OMU10C的CH3接口连接至 Slot35 OTU40G单板的L1T接口上。
检测Slot35 OTU40G的L1T接口频率配置。 故障案例1 对可能原因进行排错验证 检测Slot35 OTU40G的L1T接口频率配置。 发现L1T接口频率配置为192.1THz,与OMU10C的CH3接口频率(192.3THz)不匹配。 故障点找到。下一步需要明确到底是使用192.1THz还是192.3THz,为此我们检查了中心机房的OTN频率配置,发现其使用的是192.1THz。于是明确汇聚1区机房OTN也应采用192.1THz。 做出修改动作,将Slot35 OTU40G的L1T接口连接至Slot32 OMU10C的CH1接口。
接下来观察故障是否排除。用PTN1与RT1对接IP互Ping。此时能Ping成功,说明做出的修改是正确的。 故障案例1 对可能原因进行排错验证 接下来观察故障是否排除。用PTN1与RT1对接IP互Ping。此时能Ping成功,说明做出的修改是正确的。
故障案例1 对可能原因进行排错验证 观察OSPF邻居是否已正常建立。 OSPF邻居已建立,故障彻底排除。
但是如果所有分析出来的故障原因都已排除,故障依然存在,则需要重新分析,发掘还有哪些故障点是没有考虑到的,之后再次排查。 故障案例1 循环进行故障排查 本案例不需要再次循环排查。 但是如果所有分析出来的故障原因都已排除,故障依然存在,则需要重新分析,发掘还有哪些故障点是没有考虑到的,之后再次排查。 比如说,本案例虽然PTN1与RT1对接IP虽然能Ping通,但是仍然没有看到邻居关系,那么就要重点检查OSPF的配置,再次排查。
4台PTN形成OSPF邻居,并希望彼此的loopback地址能互相Ping通。 故障案例2 网络拓扑 4台PTN形成OSPF邻居,并希望彼此的loopback地址能互相Ping通。
发现汇聚2区PTN1无法Ping通汇聚3区PTN1的loopback地址99.3.31.6。 故障案例2 故障现象观察 发现汇聚2区PTN1无法Ping通汇聚3区PTN1的loopback地址99.3.31.6。
故障案例2 故障信息采集 首先,查看汇聚2区PTN1是否有99.3.31.6的路由。
其次,从汇聚2区PTN1 Trace 99.3.31.6,查看结果。 故障案例2 故障信息采集 其次,从汇聚2区PTN1 Trace 99.3.31.6,查看结果。
路由表中OSPF路由已经学习到,且cost值正确,说明此拓扑中OSPF协议无问题,且这4台PTN间的物理连接和OTN配置都是正确的。 故障案例2 经验分析和理论判断 路由表中OSPF路由已经学习到,且cost值正确,说明此拓扑中OSPF协议无问题,且这4台PTN间的物理连接和OTN配置都是正确的。 Trace到63.166.11.6后,无法再向下一跳转发,应重点查看此节点的路由表,看是否有错误。 此处还应排除一种故障可能性,即汇聚1区PTN1错误的配置了99.3.31.6作为自身的IP地址。这种可能不会出现,是因为Trace并没有完成。 汇聚1区PTN1的路由配置错误; 2. 其他网络节点路由配置错误。 整理可能的原因列表
发现一条静态路由,目的地址是99.3.31.6,正因为此静态路由下一跳不是去向汇聚1 故障案例2 对可能原因进行排错验证 检测汇聚1区PTN1的路由表。 发现一条静态路由,目的地址是99.3.31.6,正因为此静态路由下一跳不是去向汇聚1 区的PTN2,造成数据包转发的错误的下一跳设备,造成故障。
删除掉此静态路由,再次查看汇聚1区PTN1路由表。 故障案例2 对可能原因进行排错验证 检测汇聚1区PTN1的静态路由配置。 删除掉此静态路由,再次查看汇聚1区PTN1路由表。
故障案例2 对可能原因进行排错验证 检测汇聚1区PTN1的静态路由配置。
删除掉此静态路由,再次查看汇聚1区PTN1路由表。 故障案例2 对可能原因进行排错验证 删除掉此静态路由,再次查看汇聚1区PTN1路由表。 从这个路由表可以看出,99.3.31.6的路由已经恢复为正确的OSPF路由。
故障案例2 对可能原因进行排错验证 在汇聚2区PTN1上Ping 99.3.31.6。 至此,故障得以排除。