障礙管理 ( Fault Management) 陳彥錚 (Yen-Cheng Chen) yencheng@mcu.edu.tw http://www.im.tj.mcu.edu.tw/~ycchen/
障礙管理(FM)定義 Fault Management (FM) Detection of a problem, fault isolation and correction to normal operation. 障礙管理 儘早偵測問題之發生,進行障礙之隔離,進而解決改正問題,使網路或系統恢復正常運作。
障礙管理之功能 Maintain and examine error logs Accept and act upon error detection notifications Trace and identify faults Carry out sequences of diagnostic tests Correct faults
障礙管理實施步驟 發現障礙 隔絕障礙 排除障礙 Identifying the occurrence of a fault on the network. 隔絕障礙 Isolating the cause of the fault. 排除障礙 Correcting the fault.
發現障礙 事件報告 (Event) 週期性探詢(Polling) 網路設備自行發現問題時,主動向網管系統發出事件報告(Event Report)。 注意:當網路設備完全故障時,無法發出任何事件報告。 週期性探詢(Polling) 網管系統每隔一段時間主動發出偵測訊息至被管設備,或向被管設備要求障礙相關網管資訊 。
探詢週期 障礙監測之探詢週期一般設為5~15分鐘 探詢週期決定因素: 及時性需求 被管設備之數目 網路頻寬 處理時間 網管通信協定之限制 例如: SNMP: Counter (32-bit) 資料歸零問題
PING PING: Packet Internet Groper 補充資料 PING PING: Packet Internet Groper PING為一利用ICMP ECHO / ECHO Reply所設計之TCP/IP網路探測工具。 功能: 測試可否通達某一主機 計算封包來回時間 (Round Trip Time) 估算封包漏失率 (Packet Loss Rate)
補充資料 PING 實例
作業一 選定一網站,利用Ping偵測,說明偵測結果。 自行選用Ping工具 (Windows 98/NT、UNIX、或老師提供之Web-Based工具) 下次上課時交。
事件篩選與轉送 Event Filtering and Forwarding 補充資料 事件篩選與轉送 Event Filtering and Forwarding 較複雜或重要的網路設備(例如電信網路設備),可能會傳送出許多事件。 這些事件種類煩多、其重要性也不同。 負責處理各事件之應用程式或管理人員也可能不同。 針對所發出之事件進行篩選與轉送。
事件篩選轉送機制 ISO/ITU-T X.734 事件篩選轉送機制 補充資料 事件篩選轉送機制 ISO/ITU-T X.734 事件篩選轉送機制 事件轉送鑑別器 EFD (Event Forwarding Discriminator) 可依據事件發生之物件、事件之型態、事件發生之時間進行篩選。 對於篩選通過之事件可指定轉送至某一目的地,當此目的地無法接收時,甚至可以設定送至另一備援目的地。 註: EFD為一軟體物件(Object) 。 EFD可置於管理者端或被管理者端。 EFD物件個數依需要而定,每一EFD代表一種事件篩選轉送方式。
網管系統障礙管理功能 問題偵測 問題存錄(Log) 狀態顏色改變 偵測介面狀態 利用類似Ping方式,對每一被管設備進行偵測。 改變在網管系統圖形化介面中代表發生問題之設備的圖示之顏色。 偵測介面狀態 每一網路設備可能含有多個介面卡(Interface),一般網管系統會監測每一介面卡之運作狀態(Operational Status)。
網管系統障礙管理功能(續) 事件解譯(Interpret Event) 事件關聯性分析(Event Correlation) 將探詢(Polling)結果以及收到的事件,進行解譯與進一步測試,進而找出真正障礙,通知使用者。 事件關聯性分析(Event Correlation) 將探詢(Polling)結果以及收到的事件,進行關聯性分析,進而找出真正障礙,通知使用者。 事件/動作(Event/Action)機制 網管人員可以設定當某一類事件發生時,網管系統應即刻執行哪些動作(應用程式)。
事件解譯 Reply Poll Event Network Polling Receive Network Event Critical Network Event Generate Generate Interpret Network Event No 事件解譯 Event= Link Down ? Alert User Yes Check Carrier Signal on Source Carrier Exist ? Alert User Link Down No Yes Put Interface in Loopback Test Physical Layer Test Pass ? Alert User Remote Device Down Alert User Physical Layer Down No Yes
障礙(事件)報告方式 文字 (Text) 圖示 (Picture) 聲音 (Audio) Pager E-mail 以純文字訊息方式,顯示於螢幕上或圖形化使用者介面上之事件瀏覽器。 圖示 (Picture) 改變圖示顏色,或加以閃爍方式提醒網管人員。 聲音 (Audio) 以聲響方式引起網管人員注意。 Pager 以B.B. Call或行動電話短訊服務方式,即時告知網管人員。 E-mail 以E-mail方式,通知網管人員或客戶。
文字式事件存錄與瀏覽
設備狀態與圖示顏色 POP 區 一般節點 Mail伺服器 子區 WWW伺服器 DNS伺服器 其他 POP RAS T1介面 Channel/Port 子區 POP Critical Major Minor Warning Normal Unknown Disable
圖示顏色例子 State Critical Major Minor Warning Normal Unknown Color Packet Loss Rate >80% >60% >40% >20% <20% Round Trip Time > Threshold
Alarm Reporting Round Trip Time Threshold Setting Trouble Ticketing Audio Alarm Pager Alarm E-Mail Alert