Download presentation
Presentation is loading. Please wait.
1
LTE承载网调测与故障排查 v1.0
2
课程内容 调试工具介绍 告警 状态查询 光路检测 Ping Trace 故障排查方法及案例
3
告警可理解为某种类型的网络故障或隐患,由软件根据学员的配置自动生成。 告警信息分两部分,分别是当前告警和历史告警。
告警界面 告警可理解为某种类型的网络故障或隐患,由软件根据学员的配置自动生成。 告警信息分两部分,分别是当前告警和历史告警。
4
告警 详细告警信息
5
状态查询提供对路由器、PTN、OTN的数据配置结果进行查询,并显示结果。 通过状态查询,可以发现可能的故障点。
状态查询界面 状态查询提供对路由器、PTN、OTN的数据配置结果进行查询,并显示结果。 通过状态查询,可以发现可能的故障点。
6
在路由器/PTN可查询,列出该设备所有物理接口的状态和配置。
状态查询 物理接口查询 在路由器/PTN可查询,列出该设备所有物理接口的状态和配置。
7
在PTN可查询,列出该设备所有VLAN及其关联的物理接口。 Untagged接口:表示此VLAN关联的这个接口是access模式。
状态查询 VLAN查询 在PTN可查询,列出该设备所有VLAN及其关联的物理接口。 Untagged接口:表示此VLAN关联的这个接口是access模式。 Tagged接口:表示此VLAN关联的这个接口是trunk模式。
8
在路由器/PTN可查询,列出该设备所有配置了IP地址的接口状态和配置。
状态查询 IP接口查询 在路由器/PTN可查询,列出该设备所有配置了IP地址的接口状态和配置。 路由器可配置IP地址的接口包括物理接口、loopback接口和子接口。PTN可配置IP地址的接口包括loopback接口和VLAN三层接口。
9
在路由器/PTN可查询,列出该设备所有路由。路由表中的路由遵循最长匹配原则。
状态查询 路由表查询 在路由器/PTN可查询,列出该设备所有路由。路由表中的路由遵循最长匹配原则。
10
在路由器/PTN可查询,列出该设备所有OSPF邻居。
状态查询 OSPF邻居查询 在路由器/PTN可查询,列出该设备所有OSPF邻居。
11
在OTN上可查询,列出本OTN的电交叉配置。
状态查询 电交叉配置查询 在OTN上可查询,列出本OTN的电交叉配置。
12
在OTN上可查询,列出本OTN的频率配置。
状态查询 频率配置查询 在OTN上可查询,列出本OTN的频率配置。
13
选中光路检测后,将鼠标移动到左侧设备图中某OTN上,会出现选择菜单。选择源和目的端口。
14
Ping是检测两个IP地址间能否互相通信的重要工具。 点击右侧工具点击Ping按钮,在屏幕左侧设备连接图中选择源、目的设备及IP地址。
在左下方的结果反馈框中,选择“执行”,即可完成一次Ping操作,并实时反馈ping的结果。
15
Trace用于跟踪从源IP到目的IP地址的转发路径,是判断路径中故障点的重要工具。
在左下方的结果反馈框中,选择“执行”,即可完成一次Trace操作,并实时反馈Trace的结果。
16
课程内容 调试工具介绍 故障排查方法及案例 故障排查方法 故障案例1 故障案例2
17
故障排查步骤 要对网络故障进行准确分析,首先应该了解故障的各种现象,然后才能确定可能产生这些现象的故障根源。
故障排查方法 故障排查步骤 要对网络故障进行准确分析,首先应该了解故障的各种现象,然后才能确定可能产生这些现象的故障根源。 信息包括在调试工具的“状态查询”中所能观察到的信息,还有Ping、Trace、光路检测等工具的测试结果。 利用收集到的信息,并根据故障处理经验和掌握的知识,来确定排错范围。通过划分范围,确定需要关注的故障或与故障情况相关的那一部分网络设备、传输介质或终端。 如果故障比较复杂,整理一张表格,列出各种可能原因,并针对每一种可能的原因制定出详细的操作排查步骤。 当实施操作计划时,应该注意,每次只能做一个修改。如果修改成功,那么修改的结果应该进行分析并记录。如果修改没有成功,应该立即撤消这个修改。 当一个故障排查方案没有解决故障时,进入到循环故障排查阶段。在进行下一个循环之前,必须将网络恢复到实施上一个方案前的状态。
18
万绿市中心机房RT1通过OTN与万绿市汇聚1区机房PTN1对接,二者启用OSPF,应该形成OSPF邻居关系。
故障案例1 网络拓扑 万绿市中心机房RT1通过OTN与万绿市汇聚1区机房PTN1对接,二者启用OSPF,应该形成OSPF邻居关系。
19
万绿市承载汇聚1区机房PTN1(以下简称PTN1与万绿市承载中心机房RT1(以下简称RT1无法形成OSPF邻居关系。
故障案例1 故障现象观察 万绿市承载汇聚1区机房PTN1(以下简称PTN1与万绿市承载中心机房RT1(以下简称RT1无法形成OSPF邻居关系。 在调测工具“状态查询”中,中查看PTN1的OSPF邻居,没有发现RT1的邻居条目。 故障信息采集
20
从PTN1上Ping RT1的OSPF接口地址,Ping不成功。
故障案例1 故障信息采集 从PTN1上Ping RT1的OSPF接口地址,Ping不成功。
21
由于PTN1与RT1形成OSPF的接口属于同一网段,分析可能是由于PTN1与RT1对接参数配置错误,或者是其间的线缆连接有误。
故障案例1 经验分析和理论判断 由于PTN1与RT1形成OSPF的接口属于同一网段,分析可能是由于PTN1与RT1对接参数配置错误,或者是其间的线缆连接有误。 整理可能的原因列表 两端接口IP地址或子网掩码不匹配; 两端接口VLAN配置不匹配; 两端接口间线缆连接有问题; 4. 两端接口间的OTN配置有错误。
22
对可能原因进行排错验证 检查两端接口IP地址配置。 PTN1的IP地址: RT1的IP地址: 检查结果:两端配置正确。可排除此原因。
故障案例1 对可能原因进行排错验证 检查两端接口IP地址配置。 PTN1的IP地址: RT1的IP地址: 检查结果:两端配置正确。可排除此原因。
23
PTN1的VLAN配置,为access模式。
故障案例1 对可能原因进行排错验证 检查两端接口VLAN配置。 PTN1的VLAN配置,为access模式。 RT1与PTN1对接为物理接口。 检查结果:两端配置正确。
24
使用光路检测工具,检测两端OTN客户侧接口间连线是否正确。
故障案例1 对可能原因进行排错验证 使用光路检测工具,检测两端OTN客户侧接口间连线是否正确。 检查结果:系统提示万绿市承载汇聚1区机房OTN的OMU单板频率不匹配。
25
检测万绿承载1区汇聚机房OTN的OMU10C单板的频率及连线。
故障案例1 对可能原因进行排错验证 检测万绿承载1区汇聚机房OTN的OMU10C单板的频率及连线。 检测万绿承载1区汇聚机房OTN连线,发现Slot32 OMU10C的CH3接口连接至 Slot35 OTU40G单板的L1T接口上。
26
检测Slot35 OTU40G的L1T接口频率配置。
故障案例1 对可能原因进行排错验证 检测Slot35 OTU40G的L1T接口频率配置。 发现L1T接口频率配置为192.1THz,与OMU10C的CH3接口频率(192.3THz)不匹配。 故障点找到。下一步需要明确到底是使用192.1THz还是192.3THz,为此我们检查了中心机房的OTN频率配置,发现其使用的是192.1THz。于是明确汇聚1区机房OTN也应采用192.1THz。 做出修改动作,将Slot35 OTU40G的L1T接口连接至Slot32 OMU10C的CH1接口。
27
接下来观察故障是否排除。用PTN1与RT1对接IP互Ping。此时能Ping成功,说明做出的修改是正确的。
故障案例1 对可能原因进行排错验证 接下来观察故障是否排除。用PTN1与RT1对接IP互Ping。此时能Ping成功,说明做出的修改是正确的。
28
故障案例1 对可能原因进行排错验证 观察OSPF邻居是否已正常建立。 OSPF邻居已建立,故障彻底排除。
29
但是如果所有分析出来的故障原因都已排除,故障依然存在,则需要重新分析,发掘还有哪些故障点是没有考虑到的,之后再次排查。
故障案例1 循环进行故障排查 本案例不需要再次循环排查。 但是如果所有分析出来的故障原因都已排除,故障依然存在,则需要重新分析,发掘还有哪些故障点是没有考虑到的,之后再次排查。 比如说,本案例虽然PTN1与RT1对接IP虽然能Ping通,但是仍然没有看到邻居关系,那么就要重点检查OSPF的配置,再次排查。
30
4台PTN形成OSPF邻居,并希望彼此的loopback地址能互相Ping通。
故障案例2 网络拓扑 4台PTN形成OSPF邻居,并希望彼此的loopback地址能互相Ping通。
31
发现汇聚2区PTN1无法Ping通汇聚3区PTN1的loopback地址99.3.31.6。
故障案例2 故障现象观察 发现汇聚2区PTN1无法Ping通汇聚3区PTN1的loopback地址 。
32
故障案例2 故障信息采集 首先,查看汇聚2区PTN1是否有 的路由。
33
其次,从汇聚2区PTN1 Trace 99.3.31.6,查看结果。
故障案例2 故障信息采集 其次,从汇聚2区PTN1 Trace ,查看结果。
34
路由表中OSPF路由已经学习到,且cost值正确,说明此拓扑中OSPF协议无问题,且这4台PTN间的物理连接和OTN配置都是正确的。
故障案例2 经验分析和理论判断 路由表中OSPF路由已经学习到,且cost值正确,说明此拓扑中OSPF协议无问题,且这4台PTN间的物理连接和OTN配置都是正确的。 Trace到 后,无法再向下一跳转发,应重点查看此节点的路由表,看是否有错误。 此处还应排除一种故障可能性,即汇聚1区PTN1错误的配置了 作为自身的IP地址。这种可能不会出现,是因为Trace并没有完成。 汇聚1区PTN1的路由配置错误; 2. 其他网络节点路由配置错误。 整理可能的原因列表
35
发现一条静态路由,目的地址是99.3.31.6,正因为此静态路由下一跳不是去向汇聚1
故障案例2 对可能原因进行排错验证 检测汇聚1区PTN1的路由表。 发现一条静态路由,目的地址是 ,正因为此静态路由下一跳不是去向汇聚1 区的PTN2,造成数据包转发的错误的下一跳设备,造成故障。
36
删除掉此静态路由,再次查看汇聚1区PTN1路由表。
故障案例2 对可能原因进行排错验证 检测汇聚1区PTN1的静态路由配置。 删除掉此静态路由,再次查看汇聚1区PTN1路由表。
37
故障案例2 对可能原因进行排错验证 检测汇聚1区PTN1的静态路由配置。
38
删除掉此静态路由,再次查看汇聚1区PTN1路由表。
故障案例2 对可能原因进行排错验证 删除掉此静态路由,再次查看汇聚1区PTN1路由表。 从这个路由表可以看出, 的路由已经恢复为正确的OSPF路由。
39
故障案例2 对可能原因进行排错验证 在汇聚2区PTN1上Ping 。 至此,故障得以排除。
Similar presentations