前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的網絡故障排除主題范文,僅供參考,歡迎閱讀并收藏。
1系統化排錯策略
網絡故障排除是一門綜合性技術,涉及到網絡技術的方方面面,所以當聽到“網絡癱瘓了”,對于網絡管理員來說,首先應該是鎮定,其次開始第一步,分析網絡故障時,首先要清楚故障現象,應該詳細說明故障的現象和潛在的原因,然后確定造成這種故障現象的原因的類型。例如,主機不響應客戶請求服務。可能的故障原因是主機配置問題、接口卡故障或路由器配置命令丟失等。論文百事通第二步,收集需要用于幫助隔離可能故障原因的信息,如向用戶、網絡管理員、管理者和其他關鍵人物提一些和故障有關的問題。廣泛的從網絡管理系統、協議分析跟蹤、路由器診斷命令的輸出報告或軟件說明書中收集有用的信息。第三步,根據收集到的情況考慮可能的故障原因。可以根據有關情況排除某些故障原因。例如,根據某些資料可以排除硬件故障,把注意力放軟件原因上。對于任何機會都應該設法減少可能的故障原因,以至于盡快的策劃出有效的故障診斷計劃。第四步,根據最后的可能的故障原因,建立一個診斷計劃,開始僅用一個最可能的故障原因進行診斷活動,這樣可以容易恢復到故障的原始狀態。如果一次同時考慮一個以上的故障原因,試圖返回故障原始狀態就困難的多了。第五步,執行診斷計劃,認真做好每一步測試和觀察,直到故障癥狀消失。第六步,每改變一個參數都要確認其結果。分析結果確定問題是否解決,如果沒有解決,繼續下去,直到解決。網絡故障的發生時很常見的事情,而對于網絡管理員來說,就是去解決這種網絡故障,恢復網絡運行,改善和優化網絡的性能。因此部署一種能夠排除不同可能性并一步一步朝網絡問題的真實原因前進的技術方案是非常關鍵的步驟,一個較好的故障排查方案圖如下:
2分層排錯
網絡的故障到底出在什么地方?這對于很多初級網絡管理者來說是一件麻煩的事情,但是對于網絡來說,為了降低設計的復雜性,增強通用性和兼容性,計算機網絡都設計成層次結構。這種分層體系使多種不同硬件系統和軟件系統能夠方便地連接到網絡。管理員在分析和排查網絡故障時,應充分利用網絡這種分層的特點,即根據OSI七層結構的定義和功能逐一的分析和排查這是最好最快的方法。OSI的層次結構為管理員分析和排查故障提供了非常好的組織方式,由于各層相對獨立,按層排查能夠有效地發現和隔離故障,因而一般使用逐層分析和排查的方法。在應用分層思想的可以有不同的思路,可以采用自下而上的方法,也可以采用自上而下的方法,自下而上是指從物理層開始檢查直到應用層;自上而下是指從應用協議中捕捉數據,分析數組統計數據和流量統計信息以獲得有價值的信息。OSI把網絡分成了七層,從下至上(1層到7層)分別為物理層、數據鏈路層、網絡層、傳輸層、會話層、表示層、應用層,這七層模型描述了信息如何通過網絡介質從一臺計算機的軟件應用傳輸給另一臺計算機的軟件應用,這七個層次相對獨立,完成相應的網絡功能。OSI的上層(5至7層)處理應用問題,并且通常只實現在軟件中。應用層最靠近終端用戶。OSI的下層(1至4層)處理數據傳輸問題。物理層和數據鏈路層實現在硬件和軟件中。網絡層和傳輸層一般只實現在軟件中。①在查看物理層時,此時應該做的第一件事情就是檢查網絡線路。計算機后面的網卡綠色指示燈是否亮?很多情況下,你會發現這僅僅是線路存在問題。你可能也遇到過比較罕見的情況,由于線路接口比較松,加上用戶的經驗不足,所以看上去是插著的,但實際上并沒有接觸。因此應注意連接電纜是否正確,Modem、CSU/DSU等設備的配置及操作是否正確,確定路由器、交換機、防火墻等設備接口是否完好的主要通過showinterface命令,檢查每個端口是否UP,查看傳輸模式、傳輸速度、協議建立狀態等。②在確保物理層完好的情況下,應特別注意數據鏈路層,因為所有網絡層及網絡層以上的應用都建立在數據鏈路層的正常工作。數據鏈路層主要關注于相連設備的互連參數,比如封裝協議、信令格式等。③網絡層是計算機通信的關鍵層,因此網絡層檢查時要注意利用Ping命令和Traceroute命令檢查網絡的連通性。網絡層提供建立、保持和釋放網絡層連接的手段,包括路由選擇、流量控制、傳輸確認、中斷、差錯及故障恢復等。排除網絡層故障的基本方法是:沿著從源到目標的路徑,查看路由器路由表,同時檢查路由器接口的IP地址。如果路由沒有在路由表中出現,應該通過檢查來確定是否已經輸入適當的靜態路由、默認路由或者動態路由。然后手工配置一些丟失的路由,或者排除一些動態路由選擇過程的故障,包括RIP或者IGRP路由協議出現的故障。④在協議層的高層涉及到協議故障比較多,故障處理起來越來越困難,因此管理員需要懂得協議之間如何工作。首先管理員應清楚有那些程序可用,可以利用Telnet終端模擬應用程序,它可以提供對大型主機、UNIX系統、路由器、交換機等的應用程序和相關配置的命令行訪問方式。同時可以使用端口掃描器判斷哪些端口正在使用,以及借助協議分析儀(如微軟提供的網絡監視器)捕捉相應的RIP信息和UDP報頭,大多數傳輸層錯誤主要表現在ACL和NAT上面。另外日志對于網絡安全來說非常重要,記錄了系統每天發生的各種各樣的事情,你可以通過日志來檢查錯誤發生的原因,或者受到攻擊時攻擊者留下的痕跡。路由器的一些重要信息可以通過syslog機制在內部網絡的Unix主機上作日志。在路由器運行過程中,路由器會向日志主機發送包括鏈路建立失敗信息、包過濾信息等等日志信息,通過登錄到日志主機,網絡管理員可以了解日志事件,對日志文件進行分析,可以幫助管理員進行故障定位、故障排除和網絡安全管理。當網絡故障排除后,管理員應及時做好記錄,以便日后查看和使用。⑤而對于應用層來說,可以使用程序本身進行調試和排錯。
【關鍵詞】網絡故障;排除
1.排除局域網故障的步驟
網絡故障診斷從故障現象出發,以網絡診斷工具獲取診斷信息,確定網絡故障點,查找問題的根源,排除故障。
一般故障排除的步驟如下所示:
(1)觀察故障現象;
(2)記錄故障現象;
(3)列舉可能的故障;
(4)分析,確定故障;
(5)排除故障。
在上述幾個步驟中,對于一般問題,不一定每一步都做,但對于一些復雜系統中影響到關鍵業務的問題。最好按照上面的步驟進行,并且把診斷過程中的所有內容都記錄下來。養成這種習慣對故障診斷工作大有益處。
2.記錄故障現象
在這一階段,不但要查看到故障現象,還要觀察到問題的細節。兩個不通的錯誤在表現形式上可能很相似,他們的差別只是在一些細微的方面。有些時候,在這個階段多花一些時間,可能在后面的排錯過程中會節省幾倍的時間。主要做的工作有以下兩點:a、計算機有關各種現象的信息(如相關的圖像及數據,屏幕提示及各種日志信息)b、注意檢查,記錄細節。在這個階段,可以先寫下所有的內容,但不要急于下結論。列舉可能的故障閱讀記錄下來的內容,然后列出各種可能的原因。例如,某個網絡應用本身是否有問題,網絡連接有沒有壞,主機的配置是否出了問題,是否是網關的故障等。當對網絡排錯還不是很熟悉時,不妨記下所能想到的任何可能產生問題的東西。這時可以根據經驗,對系統的熟悉程度來決定他們的主次,但不要輕易排除任何一種可能。在這個階段不要試圖去找出問題所在。只要盡量多地記錄下所能想到的,而且是可能導致問題發生的原因就可以了。當然對于這一步來說,豐富的知識和工作經驗是相當重要的。當一個問題出現時,對一個新手只能列出3種可能;而對于一個熟手,可能會列出幾十種。
3.分析,確定故障
剛才列出了一大堆的可能,到底哪個或者哪幾個才是真正的原因呢?比較有效的是排除法。我們需要進行分析,并通過的常用命令以及一些特殊的工具,一步一步地去測試來驗證各種原因是否成立。但這里有個問題,就是“先做哪一步,后座哪一步”這個問題沒有嚴格的說法。
4.排除故障
通過上述步驟找到問題所在后,接下來就可以進行修復工作。認真而詳實的記錄不僅有助于一步一步記錄問題。跟蹤問題并最終解決問題,而且也為以后解決問題提供完整的技術文檔和文件。在檢查過程中要注意一下事項:
(a)不要忽視一些顯而易見的東西。插頭,連接器,電纜和開關是否是有部良接觸,這些問題是經常存在的問題。在開始查找故障之前,應該先檢查一下這些。
(b)思路要開闊一點,不要把檢查的范圍局限在一個小范圍內或者想當然地認為某方面是不可能出現問題,這樣有可能導致遺漏問題。
(c)應該特別注意出錯的報文,里面往往包含著解決問題的線索。
(d)測試問題時,最好能保證在原始環境下,因為在不同的環境下做實驗,同一個問題可能表現出截然不同的現象。
(e)有很多錯誤往往是人為因素造成的,如果平時多注意一些網絡配置和使用方法方面的知識,則可以避免大部分的錯誤。
網絡運行過程中的故障排除
大家經常遇到的是網絡運行過程中或系統安裝過程中一些網絡為什么不能連接的問題,原因也是多方面的,除一些設置或軟件禁止而使網絡不能連通外,大多是由于以下原因造成:
(a)網卡未能正確安裝或網卡本身有問題。一般插上網卡,系統沒有提示,說明網卡沒有插好或接口有問題;安裝驅動后Ping回環正確但Ping自己IP不通,首先要檢查網卡是否有問題;Ping本機IP通但相鄰微機不能通訊,首先應該檢查網線或網卡接口是否有問題。網卡檢測最好的辦法是代替法,即用問題網卡代替運行正常的同型號網卡。在使用替換法之前最好檢測一下本機網卡是否插好,不妨換個插槽試試。
(b)TCP/IP協議的問題。微機之間不能通訊有問題,原因大多是由于TCP/IP協議引起的。由于TCP/IP協議本身很脆弱,容易導致通訊不暢通,一般表現是相鄰微機之間不能通訊(網上鄰居或搜索計算機找不到);還有一些雖然Internet能正常連接,相鄰微機之間卻不能通訊,這一問題在一些Win98系統中較常見。解決這一問題的辦法就是重新添加TCP/IP協議。添加TCP/IP協議在Win2000及以后的系統中要特別注意,刪除該協議也許意味著你系統的崩潰,所以在重新啟動前要保證該協議能夠正確添加上(Win98不會有此類問題)。檢測方法:在排除連接錯誤和網卡接口錯誤后,Ping本機IP通,但相鄰微機不能通訊,是否因TCP/IP協議引起故障就應該注意了。
(c)驅動程序問題。這一問題主要表現在一些雜牌網卡上,由于沒有正確的驅動,只能使用一些兼容驅動程序,從而產生各種意想不到的問題。檢測方法ing回環正確但Ping自己IP不通,說明網卡驅動可能有問題(應排除網卡硬件故障原因)網卡驅動安裝不正確。
(d)網絡設置問題。網絡設置包括IP、掩碼、網關和DNS等,撥號上網還包括用戶名和密碼。因此在網絡故障出現后,首先檢查設置是否有問題。一些使用DHCP服務的網絡這一問題就簡單多了,不需要自己設置網絡。
網絡故障管理是當今網絡管理體系結構的一個主要組成部分,涵蓋了諸如檢測、隔離、確定故障因素。糾正網絡故障等功能。故障管理的目標是提高網絡可用性,降低網絡停機次數并迅速修復故障。
作者簡介:
【關鍵詞】氣象業務網絡故障診斷故障排除
隨著越來越多的先進技術和服務引入到氣象業務網絡中,網絡管理和維護工作變得越來越復雜。局域網在氣象系統廣泛應用中,常遇到各種故障,正式運行的網絡一旦出了問題,需要及時進行檢測和診斷,盡快定位并排除故障。
下面介紹一下網絡故障的診斷和排除方法。
一、主要的故障種類
根據網絡故障的性質把網絡故障分為物理故障與邏輯故障,也可根據網絡故障的對象把網絡故障分為路由故障和主機故障。
1.1物理故障
物理故障即硬件連接故障,指的是設備或線路損壞、插頭松動、線路受到嚴重電磁干擾等情況。網卡沒有連接到主板上,網卡的電源燈和數據燈都不亮,設備管理器中檢測不到網卡。網線沒有連接好,網卡已經驅動,協議也添加,但仍然不能上網,觀察網卡硬件連接,網卡只有一個燈亮,不閃爍。
如兩個路由器Router直接連接,這時應該讓一臺路由器的出口連接另一臺路由器的入口,而這臺路由器的入口連接另一路由器的出口才行。當然,集線器C6D、交換機、多路復用器也必須連接正確,否則也會導致網絡中斷。還有一些網絡連接故障比較隱蔽,要診斷它只有靠經驗。
1.2邏輯故障
邏輯故障中最常見的情況就是配置錯誤,指因為網絡設備的配置原因而導致的網絡異常或故障。配置錯誤可能是路由器端口參數設定有誤,或路由器路由配置錯誤以至于路由循環或找不到遠端地址,或者是路由掩碼設置錯誤等。邏輯故障的另一類就是一些重要進程或端口關閉及系統的負載過高。如線路中斷,沒有流量,用ping發現線路端口不通,檢查發現該端口處于down的狀態,說明該端口已經關閉,導致故障。
1.3路由器故障
線路故障中很多情況都涉及到路由器,也可以把一些線路故障歸結為路由器故障。檢測這種故障,需要利用MIB變量瀏覽器,用它收集路由器的路由表、端口流量數據、計費數據、路由器CPU的溫度、負載以及路由器的內存余量等數據,通常情況下網絡管理系統有專門的管理進程,不斷地檢測路由器的關鍵數據,并及時給出報警。
1.4主機故障
主機故障常見的現象就是主機的配置不當。如主機配置的IP地址與其它主機沖突,或IP地址根本就不在子網范圍內,由此導致主機無法連通。主機的另一故障就是安全故障。主機沒有控制其上的finger、RPC、rlogin等多余服務。而攻擊者可以通過這些多余進程的正常服務或bug攻擊該主機,甚至得到Administractor的權限等。
二、故障的檢測和診斷
大多計算機用Windows操作系統,Windows提供了一些命令行檢測工具,這些工具是網絡診斷中常用的,而且一般的問題大都可以通過這些命令診斷出來。如果對這些命令很熟悉,在網絡出故障時就會運用自如。
2.1用連接故障診斷工具Ping網絡診斷
輸入命令:ping172.18.82.201(172.18.82.201為本機地址),顯示:Pinging172.18.82.201with32bytesofdata:Replyfrom172.18.82.201:bytes=32time=10msTTL=128有"time="的內容,表明可以ping通,網絡協議TCP/IP協議正常。執行ping命令后得到信息:Pinging172.18.82.201with32bytesofdata:Requesttimedout.表示不可以ping通,或者是tcp/ip協議可能有問題,或者是計算機到交換機間的硬件連接存在問題。
測試數據傳輸丟包,輸入Pingstatisticsfor172.18.72.56,顯示:Packets:Sent=4,Received=2,Lost=2(50%loss),Approximateroundtriptimesinmilli-seconds:Minimum=177ms,Maximum=182ms,Average=89ms信息表示發送了4個數據包,回送收到2個,丟失2個,丟失率為50%。發送數據包最快回送時間177ms,最慢回送時間182ms,平均89ms。如可以ping通自己,也可以ping通鄰居或能看到其他機器,表明本地設置正確。網關可以通過軟件實現協議轉換操作,能起到與硬件類似的作用。ping網關地址,例如ping172.18.82.17-t,就可以查看與網關是否連通。
2.2pathping命令
pathping用于跟蹤數據包到達目標所采取的路由,并顯示路徑中每個路由器的數據包損失信息,也可以用于解決服務質量連通性問題。是一個比tracert更為有用的工具。它將ping和tracert命令的功能和這2個工具所不提供的其他信息結合起來。由于該命令顯示數據包在任何給定路由器或鏈路上丟失的程度,因此可以很容易地確定可能導致網絡問題的路由或鏈路。不過WIN9X/Me、WindowsNT不提供此命令。
可以看出,它先提供給我們查看路由的結果,然后等待75s(此時間根據躍點數變化)最后顯示測試結果。第3列是源到當前的丟包數。第4列是指明線路和路由器丟包情況,最右邊的欄中標記為"|",表明沿線路轉發丟失的數據包,該丟失表明鏈阻塞;最右邊欄中為IP地址的,表明該路由器的丟失率,可能是由于路由器CPU超負荷所致。如果某一處丟包嚴重,則應采取必要的措失,以提高通信質量。
三、故障排除的解決方案
不系統的故障診斷與排除方法將導致在網絡故障現象相互依賴和偶然性的迷宮中浪費時間。系統的網絡故障排除方法的總體思路是系統地將產生故障可能的原因所構成的1個大集合縮減成1個小的子集或者直接確定故障起因。
3.1網絡適配卡中斷與其他硬件資源沖突
在"系統"的"設備管理器"查找旁邊出現感嘆號的有黃圈的網絡適配器項目,找到項目網絡適配器可能與其它設備使用同樣的資源設置。雙擊網絡適配器項目,在網絡適配器"資源"中更改網絡適配器的中斷和I/O地址,避免與其它硬件沖突。用即插即用的網絡適配卡,可使用制造商提供的安裝盤將即插即用型改為跳線型,設置網絡適配卡的中斷和I/O地址。
3.2在"網上鄰居"中沒有顯示網絡中的其它計算機
MAC地址漂移是匯聚層交換機較為常見的告警,一般出現這種告警有三種可能:①使用了不同廠家的設備,不同廠家設備的STP協議不兼容導致,例如:思科交換機與華為交換機混合組網的情況下,處于下層的交換機容易出現該告警;②IP地址沖突,IP地址指定配置出現沖突,同一地址配置給同一交換機下多個用戶的情況下,會出現該告警;③網絡環路。案例分析:7月16日,某地機房華為9303頻繁出現MAC地址漂移告警,16號下午,該機房所屬區域寬帶用戶異常,故障現象多為寬帶掉線及無法獲取IP地址,并且報修量短時間內呈快速上漲趨勢。部分小區寬帶業務幾乎瀕臨崩潰(有線家屬院、南灣水管局等)。但是該地的數據網均采用同一品牌交換機組網,雖然在核心交換位置配置了其他品牌交換機,但是以該故障分析,核心交換下四臺匯聚交換僅有一處出現該故障,而該處未使用其他品牌交換機混合組網,這樣可排除第一個原因;網內寬帶用戶的IP地址均是從DHCP地址池中自動抓取,不同用戶在同一地址池中錯誤的抓取到同一IP地址基本上不會出現,這樣可排除第二個原因;綜合以上分析,故障原因初步判斷為網絡環路導致。因為告警位置在華為9303Gig3/0/12端口,該端口下聯該鄉的網OLT,初步判斷環路出現的地點;采用分區關斷查找故障點的方法,臨時關斷相關地點的寬帶業務的Gig3/0/12端口,MAC地址漂移告警解除,遠程檢查該鄉網寬帶設備,未發現網絡設備配置異常,進一步確認環路出現位置的具體用戶。考慮到該地網寬帶業務用戶較少,暫時關斷該地網寬帶業務觀察一夜,以便最終確認故障方向。對于網絡環路導致的故障,首先應該采用正確的方式打開環路進行檢查,然后確定故障用戶的位置,最后相關的工作人員上門進行重新正確安裝,直到故障解除。
2網頁無法打開
根據網絡用戶寬帶保修的情況來看,很多情況都是用戶網頁無法打開,或網頁打開速度過慢。案例:某小區337#樓和338#樓寬帶用戶報修較多,故障現象均為不能打開網頁,這兩棟樓屬于同一個CBAT。通過WEB頁面登錄CBAT,查看低頻終端,發現登錄速度很慢,而低頻終端打開之后,鏈路指標符合要求。鏈路指標符合要求,但用戶不能上網,且WEB網管頁面非常慢,由此可能有環路現象存在。該故障表現為用戶登錄緩慢,后臺登陸設備速度同樣緩慢。故障用戶設備錯誤的連接方式,使得低頻貓與無線路由器之間形成物理環路,導致網絡廣播風暴,網絡廣播風暴造成網絡數據傳輸擁塞,波及同一CBAT設備下用戶,導致該CBAT下用戶出現網絡速度緩慢,打不開網頁等故障現象。通過對環路的檢測,同時根據用戶低頻貓MAC地址信息,定位用戶具體住址,通知網格人員上門重新正確連接后故障解決。
3網絡廣播風暴
由于網絡拓補的設計和網絡連接的問題,或其他原因導致廣播在網段內大量復制,傳播數據幀,導致網絡性能下降,甚至出現網絡癱瘓。一般情況下,產生網絡廣播風暴的原因,主要有以下幾種:①網絡設備原因:我們經常會有這樣一個誤區,交換機是點對點轉發,不會產生廣播風暴。在我們購買網絡設置時,購買的交換機,通常是智能型的Hub,卻被奸商當做交換機來賣。這樣,在網絡稍微繁忙的時候,肯定會產生廣播風暴了;②網卡損壞:如果網絡機器的網卡損壞,也同樣會產生廣播風暴。損壞的網卡,不停向交換機發送大量的數據包,產生了大量無用的數據包,產生了廣播風暴。由于網卡物理損壞引起的廣播風暴,故障比較難排除,由于損壞的網卡一般還能上網,我們一般借用Sniffer局域網管理軟件,查看網絡數據流量,來判斷故障點的位置;③網絡環路:曾經在一次的網絡故障排除中,發現一個很可笑的錯誤,一條雙絞線,兩端插在同一個交換機的不同端口上,導致了網絡性能急驟下降,打開網頁都非常困難。這種故障,就是典型的網絡環路。網絡環路的產生,一般是由于一條物理網絡線路的兩端,同時接在了一臺網絡設備中;④網絡病毒:目前,一些比較流行的網絡病毒,Funlove、震蕩波、RPC等病毒,一旦有機器中毒后,會立即通過網絡進行傳播。網絡病毒的傳播,就會損耗大量的網絡帶寬,引起網絡堵塞,引起廣播風暴。對于網絡風暴,首先應該對相關的網絡產品進行正確的安裝,同時做好網絡安全防范工作,在故障發生后,也應該通過專用的檢測,確定故障發生的原因,然后進行故障排除。
4配置信息錯誤
故障分析:某用戶在設備安裝后,單向收看節目正常,但是雙向點播節目收看過程中提示網絡故障,但是數字表測量信號非常好,同時EOC終端RSSI指示燈處于正常的閃爍狀態,測試網絡十分通暢。對相關的配置信息進行查看,然后進行手動認證,結果提示———用戶名或密碼錯誤。這種故障一般是授權信息的錯誤,需要重發授權。在聯系客服,并重發授權后恢復正常。另一個客戶雙向故障,點播功能無法正常使用,手動認證同樣提示用戶名或密碼錯誤,在重發授權后仍然無法正常使用,在與客服溝通夠,將原來的用戶密碼進行了修改,重新輸入后成功,初始密碼統一為111111。另外,如果接頭不規范也會對點播功能造成影響,主要是接頭會影響到點播高頻信號,如同單向故障般,引起馬賽克,馬賽克次數頻繁會導致異常退出,一般這類故障都是接頭不規范。
5CBAT問題和光鏈路問題
CBAT的PLC低頻模塊故障或交換板故障,會導致所帶寬帶貓不能上網或者在后臺根本看不到設備,此時需要更換CBAT,典型現象為:排除分配網故障之后,CBAT下接有低頻低頻寬帶貓,但PLC的cable燈不閃爍,而將低頻毛接在其他CBAT下正常,此時可以確定為CBAT故障,更換CBAT。光鏈路問題:CBAT接收光功率范圍在-14dB~-28dB之間,若光功率過低,會在ONU模塊顯示Alarm告警或Los告警,此時應查詢光鏈路故障來提高光功率解決問題。有時光功率低,ONU模塊沒有紅燈告警,但是PON等不亮或慢閃爍,這也是光功率過低造成,同樣需要查詢光鏈路,提高光功率來解決問題。
6結束語
【關鍵詞】集中控制體系結構CCA;ARCNet網絡;故障分析及排除
HXN5 Locomotive CCA Network Structure and Troubleshooting
CHANG Hong-jie1 WANG Rui-na2
(CSR Qishuyan Locomotive co., ltd.Customer service department,Changzhou Jiangsu 213011,China)
CSR Qishuyan Locomotive co.,ltd. Technology department,Changzhou Jiangsu 213011,China)
【Abstract】In view of HXN5 locomotive network control system for research, analyzes its control principle, introduced the ARCNet network functions, parameters and its processing method of fault diagnosis.
【Key words】CCA centralized control architecture;ARCNet network;Failure analysis and troubleshooting
0 引言
集中控制體系結構(CCA)由相互聯系的許多電子單元組成,它是一個基于計算機的電子控制系統。CCA 執行所有測量、計算、決策以及控制操作及其他車載系統所需的功能。此種控制系統,以微型機為核心,采用單元組合方式,根據不同需要靈活組合成一個完整系統。該系統既有計算機控制系統控制算式先進、精度高、響應速度快的優點,又有儀表控制系統安全可靠、維護方便的優點。
1 ARCNet網絡
1.1 拓撲結構
HXN5機車的CCA結構中,智能顯示器是主要的控制計算機,其他的設備,諸如集成式輸入/輸出控制板(CIO)、牽引電動機控制器(TMC)和柴油機控制單元(ECU)等均受其控制,它們通過一個串聯的通信網絡相互連接,該通信網絡被稱為ARCNet。
1.2 技術參數
網絡電纜是特殊構造的電纜,用于傳遞信號并降低噪聲敏感性和減少對外擾動。在HXN5型機車上,ARCNet是通過使用DB9插頭連接機車上所有微機控制智能面板的四線網絡而實現的。該網絡電纜容納兩個獨立的網絡(網絡0、網絡1),每個網絡由兩根電纜線組成,通過采用雙絞線耦合來降低噪聲干擾。ARCNet基本技術要求:
數據傳輸速率:5Mbps,最大10Mbps;
設備間距:雙絞線電纜與兩端終端設備的距離60m;
負載時驅動輸出信號電平(最小):±1.5V;
空載時驅動輸出信號電平(最大):±6V;
接收輸入電壓范圍:-7V~+12V;
設備最大編號:20;
多個A、B 通道相連時,每通道兩根線。
1.3 數據傳輸
HXN5機車由兩個ARCNet物理網絡用于控制系統。所有面板都通過這兩個網絡進行通信。接有電攬的ARCNet統一控制構架體系(CCA)使用簡單的交替算法,該算法將更新的采樣數據傳到與上一次使用的數據傳遞網絡相對的網絡上。交替算法使得數據傳遞對一個網絡只有50%的依賴性。兩個物理網絡用于相互提供冗余,當一個網絡發生故障時仍有50%的控制數據可以通過另一個網絡成功傳輸。
2 故障分析
智能顯示器DS1、DS2、DS3是主要的控制計算機,它們通過使用ARCNet網絡傳遞和接受相關信息,從而達到控制機車上所有其他計算機和功能模塊運行的目的。當機車控制信號傳遞異常時,智能顯示器屏幕和機車日志里會出現相應“網絡故障”的提示,此時需要進入級別3(IL3)調出“控制網絡監視器”查看以便進一步確定故障所在。
2.1 故障現象
“控制網絡監視器”屏幕中包含“重新配置次數”――該數字是每個網絡自通電以來重新配置的次數。試圖訪問網絡的節點導致重新配置。這些節點可能已經斷開連接并正在嘗試重新建立連接,或節點可能正首次(即通電時)接入網絡。從“控制網絡監控器”屏幕可以看到各個面板網絡上重新配置的次數。
表1 ARCNet網絡DB9連接器引腳功能定義
當網絡異常時,網絡重新配置0/網絡重新配置1的計數會以每秒1次或更大數值的速率不斷遞增,通過該計數可以確認故障的發生。
2.2 故障排除
影響機車信號傳遞的因素有兩個:1) 機車各個智能控制面板;2)ARCNet網絡電纜。
2.2.1 對失效面板進行故障排除
要確定某個面板是否是重新配置源,可以使用以下兩種方法。
(1)斷開該面板的電源――逐個斷開面板的電源。這就從網絡中除去了該節點,但網絡仍然會使用網卡中的網絡跟蹤來完成總線配置。此時如果重新配置數繼續遞增,就可以排除對該面板的懷疑。
(2)用旁路法通過將面板的ARCNet網絡電纜連接在一起來旁路該面板――這將完全旁路該面板。如果重新配置數繼續遞增,就可以完全排除對該面板的懷疑。
2.2.2 對失效電纜進行故障排除
在網絡中信號傳遞時總線的每一端都需要網絡終結器,以確保信號的完整性。終結器短接接頭由DB9接頭組成,它將引腳3跳接/短接到引腳7,將引腳5跳接/短接到引腳9(如圖1所示)。在終結器跳接線對之間增加一條電纜,防止失去終結器,同時又保持了物理一致性。
DB9插頭引腳功能定義如表1所示。
要確定故障是否是在其中一條網絡電纜中,可以使用短接插頭來構造一個較小的網絡,然后將電纜重新恢復到網絡中。具體方法如下:將所有網絡電纜連接在一起,僅在環路中留下3個面板,在CIO面板上的CIO-WB處裝上一個短接插頭,從最后一個面板開始,逐漸移動終結器,如果重新配置計數停止,則證明此前連接的一根電纜為故障電纜,對故障電纜應該更換。
圖1 終結器短接DB9接頭內部接線原理圖
3 結束語
在實際運用中,機車網絡故障的表現形式各異,針對HXN5機車CCA體系故障,首先應分析其提示信息,仔細觀察故障現象,根據工作原理和相關網絡拓撲結構特點,對可能的故障點逐一排查,在有條件時采用構造法和旁路法等方式,最終確認故障原因,從而排除故障,確保機車的正常運用。
【參考文獻】
計算機網絡的領域廣闊無邊,網絡故障的原因千差萬別。社會的發展將計算機網絡和人們的日常工作、生活都聯系到了一起,對于網絡的依賴度也越來越大,網絡故障的產生也隨之不斷增加,給人們的工作、生活造成了極大的影響,為了能夠更好地使用計算機網絡,確保網絡和人們的日常生活合理有序地運轉,必須盡快對計算機網絡故障做到及時排查和修復,將損失降到最低。
1 計算機網絡故障的種類
1.1 網卡出現故障
網絡適配器一般放置在計算機主機內部,通常由網卡插槽和網卡本身的物理引擎組成,網卡的故障主要是網卡插槽損壞或者網卡本身損壞等。網卡故障會導致計算機本身的系統啟動速度變得緩慢,雖然安裝了網卡但是卻不能正確地上網等,將網卡安裝進計算機后系統顯示無網卡插入或者造成驅動運行錯誤。
1.2 路由器出現故障
路由器故障包括交換機故障,大多是由物理原因導致的外力損壞使得路由器和交換機無法正常工作。影響網絡的正常運行,造成計算機運行緩慢或者無網絡連接等情況的發生,路由器無法訪問大的網絡環境,導致計算機失去網絡的連接,計算機本身與網絡斷開連接,導致數據無法正常傳輸,也沒法對端口進行遠程訪問。
1.3 計算機主機出現故障
計算機主機的故障是計算機故障中最為常見的故障之一,是指網絡驅動沒有安裝前或者由于網卡驅動安裝錯誤引發的無網絡鏈接的情況,導致計算機無法正常工作,網卡插槽和其他主機的電子元件的適配性受到影響,導致計算機無法正常運行,主機安裝協議的服務和同類型計算機不一致導致的無效的網絡連接。主機出現的網絡故障還包括受到外力因素影響的故障,比如電腦被黑客攻擊導致無網絡連接、主機內部資源被竊取和主機系統不穩定等。
2 計算機網絡的故障定位
2.1 告警性能
通過對網絡管理員咨詢獲得告警信息并對故障發生的位置進行定位追蹤,通過對系統內的網絡設備進行管理和分析,一旦發生故障時,迅速通過網絡管理者監督觀察計算機路由器和交換機的情況,通過檢查交換機或者CPU的負載率是否超過正常指標,我們可以判斷出造成計算機網絡故障的計算機究竟是哪一臺。
2.2 查閱網絡日志
對出現計算機網絡故障的計算機的網絡日志進行翻閱,通過數據的對比來分析計算機運行的狀況,在查看計算機組成部分以及光纜、網線、路由器、交換機以及適配器等無果之后,可以對計算機內部的網絡日志進行數據分析,這樣能夠提前預防和控制計算機網絡故障的產生和發展。
2.3 配置數據
通過查詢當前的網絡設備來配置計算機的數據和資源,通過分析計算機的網絡日志和網絡配置數據來對計算機的網絡故障進行排查,若開始對計算機的配置出現失誤,則需要進行重新配備。對出現故障的計算機網絡零件或設備要及時更換,以達到修復計算機網絡故障的目的。
2.4 排除法
當計算機的網絡連接出現問題時,我們要對計算機的各個功能性模塊進行排查。例如,對服務器、主機、路由器以及電纜進行分析和處理。若計算機顯示網絡故障時本地連接斷開,那就應該對計算機的網卡以及交換機端口進行網絡數據的測試和排查,逐一排查計算機的網絡參數和配置問題,網絡協議和網絡設備的自動修復功能是否正常運行,找到并解決計算機網絡故障的源頭。計算機網絡故障的出現也有一定概率是DNS配置出現失誤,若IP地址和默認地址不符或者DNS配置出現失誤時,可以通過360軟件斷網修復或者重新配置DNS來解決。
3 怎樣預防計算機網絡故障的產生
3.1 硬件的維護
計算機運行的基礎是計算機各組成部分的電子元件和模塊,計算機硬件的維護是十分必要的,經常對計算機進行日常的檢查和對計算機的網絡故障進行處理是十分必要的。計算機硬件的日常檢查一般要對網線、網卡設備和交換機進行例行的數據測試,再對計算機的顯示屏進行數據測試,對主機的性能以及各模塊的正常運行做出檢查后,計算機的硬件維護就基本完成了,當檢查中出現問題應該立刻對計算機故障的部位進行修理,如果不能修理的應該及時更換,避免計算機的運行故障造成損失。在硬件維護上要保障聯網測試的計算機的硬件是能夠滿足現代互聯網連接要求的,以維持計算機網絡連接的準確性。
3.2 軟件的維護
定期對計算機內置的殺毒軟件進行數據清查和垃圾處理,對計算機的安全性能進行檢測,定期升級和維護計算機內部的殺毒軟件,做到隨時隨地開啟電腦防火墻,以避免外界因素的入侵和干擾。計算機網絡設備要做到定期檢測,定期對計算機網絡做出檢測和使用,查看網絡協議是否有效,服務器的運行是否正常。
4 結束語
計算機的網絡現在處于高速發展階段,但是,生活是把雙刃劍,計算機飛速發展帶給人們便利的同時,計算機的網絡故障也帶給人們損失和不便,要提高對計算機網絡安全的放緩意識,養成定期檢測計算機網絡運行的習慣,才能真正加強對計算機網絡故障的排查和處理。
關鍵詞:網絡技術;維護系統;故障排除
中圖分類號:TP393 文獻標識碼:A
1 醫院網絡技術維護工作概況
隨著計算機技術在各領域應用取得顯著進展,利用以太網進行通信及智能化技術的迅速成熟,網絡技術維護工作逐漸朝數字化方向發展,也使得數字化網絡技術在醫院管理系統中不斷深入。基于WEB技術的網絡技術維護工作是在數字化編程技術基礎上發展起來的,采用領先技術,安全可靠、低碳環保的智能化裝置組合而成,以高速網絡通信平臺作為系統基礎,自動完成采樣、密匙、保護、監控、記錄、防范、查詢等基本功能,并能根據實際需求完成系統實時智能化監控和調節,在線分析和決議,與其他系統交互等應用功能。
智能編程是基于WEB標準的,而該技術標準是“編程通信網絡與系統”系列標準。它為編程自動化系統定義了統一、標準化的信息交互模型,實現了醫院網絡技術維護工作的信息統一建模,解決不同設備之間的互操作性問題,為編程內各種信息的整合和共享奠定基礎。通過采用 WEB 標準的建模方式,系統編程可實現對醫院網絡安全的狀態數據、監測數據、檢測數據、環境數據和動作信息的整合和共享,形成編程一體化信息平臺,為網絡技術維護工作提供完整、精確、實時、一致、可靠的數據。
在醫院網絡技術維護工作中,需要對系統進行監視、控制和管理來掌握其運行狀態。隨著系統實現的功能越來越多,結構越來越復雜、處理的信息量越來越大,對數據的可靠性、實時性、一致性和共享性提出了更高的要求。于是各功能模塊需要一個數據庫系統來管理維護這些共享數據,這些數據可能采用了不同的數據結構、數據類型或表示形式等,這在一定程度上影響了編程自動化的建設。如何將編程內的各類數據相互轉換,集中管理、統一使用,實現數據之間基于網絡方式的交換、共享已經成為當前醫院網絡技術維護工作亟需解決的問題之一。
2 醫院網絡技術維護系統中常見問題及故障排除
2.1 數據庫故障排除。醫院網絡技術維護系統資源中的數據庫具有數據結構化、冗余度低、程序與數據獨立性較高、能批量處理數據、易于擴充和索引、易于編制應用程序、同時可清晰表達SCL配置文件等優點,故選用關系數據庫來完成SCL配置文件的數據建模,利用現有數據庫的密匙、備份、恢復、并發控制等技術可有效地對數據進行管理。借助數據庫技術,根據WEB標準關于數據模型的描述,把SCL文件提供的配置信息進行關聯、配置,導入數據庫中,根據需要導出數據庫相關的信息,映射轉換成符合要求的配置文件,實現信息復用的目的。在數據庫中,表是數據信息密匙的基本結構,表的設計可以決定顯示模塊和其他功能模塊從數據庫中提取數據的方式。在采集編程描述信息SSD文件時,通過在數據庫中設計了一系列的表,以實現數據防丟失、防竄改、備份和維護等基本功能。
2.2 ICD文件丟失故障。醫院網絡技術維護系統中的ICD文件只供配置工具使用,由于ICD文件包含的信息量不小,在維護時很容易丟失,這樣會影響數據庫的運行,所以數據庫的結構設計應盡量簡潔,只需將必要的信息密匙在數據庫中,方便圖形顯示界面模塊調用數據。ICD文件包含的信息可分為標記和數據兩部分,其中標記部分的由WEB標準規定,屬于靜態部分,不需要建表密匙在數據庫中;而數據部分則需要根據實際情況而定,屬于動態部分,也是數據庫的關鍵內容,故需要建表密匙在數據庫中。
2.3 網絡協議配置錯誤。網絡協議配置一般采用關系數據庫來管理編程中的相關數據,網絡協議數據庫中包含多張表,表中的數據都是以行和列的二維表形式組織在一起的,每行表達了一個唯一的數據記錄,列也稱為“字段”,表示數據的種類或屬性。各表之間通過某種聯系關聯起來,組成我們需要的網絡協議。為了實現網絡協議互操作性和可擴展性,避免發生配置錯誤,我們可以利用WEB標準通過采用面向對象的方法建立編程設備的對象模型,定義了基于Client/Server的分層數據模型,數據對象描述方法以及面向對象的服務。
2.4 網絡密匙系統的設計。目前,醫院網絡的密匙方式基本上可分為三類:文件系統、密匙管理器和數據庫管理系統。數據庫管理系統方式中的基于關系數據庫的密匙管理是一種應用比較廣泛的方法。根據密匙時是否使用XML模式,基于關系數據庫的密匙方法又能分為結構映射和模型映射。不管采用哪種映射方法,都需要先對醫院網絡進行編碼。XML編碼是指對文檔樹的每個節點都按一定的算法進行惟一性編碼,根據任兩個節點的編碼,能夠直接判斷這兩個節點之間是否有祖先、后代等結構關系。目前已經提出了多種編碼方案,如區域編碼、前綴編碼、素數編碼等。
2.5 醫院網絡防范系統的設計。醫院網絡防范是醫院網絡密匙的逆操作,是指從關系表中提取密匙在其中的數據和一些元數據,與相應元素或屬性一起重新組成符合規范形式。換句話說,防范醫院網絡是將散落在多個關系表中的數據重新整合,形成一個完整的XML。相對于密匙系統,防范系統的設計較簡單。防范系統需能夠恢復原醫院網絡片斷的結構和內容,同時保證醫院網絡的完整性和一致性。設計的主要思想是通過獲取節點編號Num,在關系數據庫中查找對應的關系模式表的信息,再將查詢的數據重新組合成文檔片斷。
結語
現階段,我國對網絡技術維護工作越來越重視,傳統網絡技術維護方式已然不能適應當前的需要。基于此,將先進的網絡化技術應用到網絡技術維護工作的設計工作中來無疑是勢在必行的。本文詳細分析了醫院的網絡技術維護工作,研究發現,該系統不但可以充分達成網絡技術維護的各項任務指標,并同時還增加了大量新的管理模塊,實現了網絡技術維護工作的智能化與高效化。
關鍵詞:故障 網絡故障 分析和處理 流程
中圖分類號:TP316.8 文獻標識碼:A 文章編號:1007-9416(2016)11-0053-02
1 引言
計算機網絡已經成為了我們日常工作和生活中必不可少的一個組成部分。體會到了網絡的重要性、便捷性,同時我們也希望網絡能夠具備很好的安全性和穩定性。在網絡運維工作中,網絡故障分析和處理工作是占比最大的,也是最重要的。網絡故障的分析和處理需要依靠經驗,但也需要遵循一套通行、標準的流程。
2 網絡故障分析與處理流程
當出現網絡故障時,最困難的是如何快速進行故障定位,并確定發生的原因。對于網絡管理人員來說,有一個清晰的故障排除思路和豐富的網絡故障分析處理經驗在迅速排除網絡故障的過程中是非常重要的。
其中有一點小竅門是運用基于案例推理的網絡故障分析技術。即當新故障出現時,首先考慮是否以前曾經處理過相同的故障案例。如果有則直接運用,如沒有則搜索相似故障案例,以此來尋找故障可能的原因。
但分析和處理網絡故障的標準流程如圖1所示。
流程圖中相應元素的詳細闡述如下:
2.1 詳細故障描述,信息收集
一定要清晰、準確地描述出故障,收集詳細的故障信息。鑒于專業技術背景不同,可以由網絡管理員對用戶作一些引導性的提示,讓用戶描述清楚故障的時間和現象、做了何種操作等等。并且從網管軟件、流量分析設備、診斷命令等處收集有用的信息,做好故障原因分析前的準備工作。
2.2 分析原因,考慮故障的可能性
根據收集的信息,運用掌握的網絡知識,分析故障的大致原因。設法減少可能的故障原因,縮小故障范圍,盡快制定出有效的故障分析處理計劃。
網絡故障的分析處理過程可以采用OSI七層參考模型為框架,逐層分析,提高故障分析的效率。可以采用自底向上、自頂向下以及從中間到兩端的順序進行網絡故障的排除。那采用哪種分層診斷分析的方法更好呢?這需要具體問題具體分析。如果判斷硬件出故障的可能更大,比如在新建網絡或增加網絡設備等情況,則選用自底向上的方法;如果判斷故障原因可能出在高層,如網絡比較成熟,只對軟件有所改變時,則采用自頂向下的方法更合適。根據OSI模型的特點,自頂向下方法的的優勢在于只要確定某一層工作正常,則就可以將位于該層及以下各層排除在故障范圍以外;如果無法判斷故障到底出在頂層還是底層,則用中間到兩端的分層分析方法更合理,一般建議從網絡層入手。
2.3 建立并實施故障排除計劃,定位并處理故障
根據可能的故障原因,制定一個故障排除計劃。由易到難,一次只嘗試一個可能的故障原因進行操作,確保能夠比較容易恢復到故障初始狀態。認真做好每一步測試,記錄好結果,以便后續檢查是否排除了故障。計劃的實施時間盡量短,最大程度上減小對現有網絡的影響。
2.4 確認故障是否排除
對上一步的操作進行檢查,確認故障是否排除。另外需要和用戶進行溝通,確保用戶認可故障已消除。
2.5 恢復故障初始狀態,重復故障排除過程
如上一步的確認結果為故障仍然存在,則按計劃恢復到初始狀態,制定并實施下一個計劃。
2.6 建立故障排除記錄文檔
確定故障消除后,需要記錄變更的內容,備份更改后的網絡設備配置及更新后的系統軟件,歸檔整理。內容包括:故障現象、分析后得出的故障原因、解決方法及步驟等。
3 網絡故障的分類
網絡故障的種類可以基于兩種方式來劃分:按性質分類以及對象分類。無論哪種方式均可以全面概括網絡故障的種類。本文僅以網絡故障對象的劃分方式作簡單介紹,大致可以分為四種故障類型:線路故障、設備故障、端口故障及終端故障。
3.1 線路故障
線路故障最常見的情況是線路不通和線路受到電磁干擾的影響。線路不通時可以通過網管軟件判斷是否出現了斷路,然后通知運營商進行恢復,也可以使用ping、tracert等命令工具來測試遠端路由的連通性來找出問題所在。如果是線路受到了電磁干擾的影響,可以采用測試儀器來分析得出干擾的位置和嚴重程度;或是使用抗屏蔽的線纜來測試。
3.2 設備故障
這種故障的處理可以通過管理軟件收集設備關鍵參數,如:端口流量、CPU的溫度、CPU的使用率、內存使用率等,并及時給出報警。比如設備CPU使用率過高和內存剩余太少都會造成丟包率的上升,解決這種故障,只有對設備進行升級、擴大內存,或者重新進行網絡規劃。另一種設備故障的原因就是設備自身的配置錯誤導致的。例如配置的協議類型不對等。這種故障的分析處理與網絡管理人員的經驗有很大關系。
3.3 端口故障
端口故障主要包括端口本身的物理損壞、插頭不緊和端口關閉。這種故障采用的分析處理方法是通過觀察端口的指示燈狀態來做出大致的判斷。此外可以通過ping近端路由來判斷是否由于端口被關閉從而造成了該故障,如果是此原因,只要重啟端口,故障就能消除。
3.4 終端故障
終端故障常見的現象就是終端配置不當。例如終端配置的 IP 地址與其它終端沖突、無效IP或非該網段IP。另一種終端故障就是安全原因,例如系統有漏洞、啟用了RPC服務、共享了本機硬盤等等,使得網絡攻擊者可以輕易攻擊終端。一般可以通過監視終端的數據流量、安裝防火墻、修復漏洞以及掃描終端端口來防止可能出現的網絡攻擊。
4 網絡故障分析常用命令
在故障分析處理過程中的信息收集階段,需要快速有效地獲得與故障有關的信息。如果使用ciscoworks或esight等網管軟件和諸如Arbor或ATM等專業流量分析設備,這些工作會輕松很多。但一般公司不會配備,所以通常采用設備或終端本身內置的一些網絡故障分析診斷命令工具來檢測網絡故障和收集信息。也可采用諸如Sniffer等抓包軟件來分析網絡故障。下面僅介紹幾種常用的網絡故障分析診斷命令。
4.1 ping命令
Ping命令是最常用的網絡測試命令,主要是用來檢查路由是否可達,該命令默認發送的數據包尺寸非常小,所以在網絡上傳輸的速度很快,可以快速檢測網絡的連通性。如果網絡不通的話會顯示“Request Timed Out”、“Destination Host Unreachable”等消息。但在有些情況下,ping不通并不代表網絡有問題,比如有些設備對這些類型的測試包進行了過濾,不允許用戶使用Ping 命令,這樣就會造成網絡不通的假象,需要特別留意。
4.2 traceroute命令
traceroute命令(UNIX系統中為traceroute,Windows系統為tracert)用于探測IP數據包在傳輸過程中所經過的路徑。常用來探測路徑中第一個故障點,效率很高。該命令可以跟蹤數據包轉發過程中每個路由節點的響應情況,驗證網絡的連通性以及在哪個節點出現了故障情況。
4.3 ipconfig命令
ipconfig能夠顯示TCP/IP協議的具體配置信息,其中包括主機名、節點類型、是否啟用IP 路由、網卡的物理地址、子網掩碼、默認網關等。了解這些信息是進行網絡故障分析和處理的必要環節,其中網卡的物理地址在檢測網絡錯誤時是非常有用的。ipconfig是一個很有用的故障分析工具,尤其當網絡中設置DHCP時,利用ipconfig可以讓用戶很方便地了解IP地址的配置情況。
5 結語
信息化時代網絡規模越來越大,網絡承載的業務越來越多,網絡復雜度也越來越高。這樣的情況下網絡故障的發生是在所難免的。作為網絡管理人員除了要有扎實的網絡理論知識,也需要在日常的工作中積累經驗。而網絡故障分析和處理作為網絡運維的一個重要方面,需要網絡管理人員掌握網絡故障分析和處理的規范流程,并嚴格按照此流程貫徹執行。同時也必須熟練掌握常用的網絡故障分析命令與工具。只有如此才能在突況下冷靜分析,快速進行故障定位,處理網絡故障。
參考文獻
[1]王成等.網絡故障診斷技術研究[J].科技信息,2011(11).
[2]霍揚,龔儉.計算機網絡故障分析及維護研究[J].硅谷,2008(7).
【關鍵詞】網絡 互聯網路由器 故障診斷
中圖分類號:TP393.4文獻標識碼: A
一、緒論
(一)、計算機網絡概述
1、計算機網絡是由計算機集合加通信設施組成的系統,即利用各種通信手段,把地理上分散的計算機連在一起,達到相互通信而且共享軟件、硬件和數據等資源的系統。計算機網絡按其計算機分布范圍通常被分為局域網和廣域網。局域網覆蓋地理范圍較小,一般在數米到數十公里之間。廣域網覆蓋地理范圍較大,如校園、城市之間、乃至全球。計算機網絡的發展,導致網絡之間各種形式的連接。采用統一協議實現不同網絡的互連,使互聯網絡很容易得到擴展。因特網就是用這種方式完成網絡之間聯結的網絡。因特網采用 TCP/IP 協議作為通信協議,將世界范圍內計算機網絡連接在一起,成為當今世界最大的和最流行的國際性網絡。
(二)、常見計算機網絡故障分類及影響網絡故障診斷應該實現三方面的目的:
1.確定網絡的故障點,恢復網絡的正常運行;
2.發現網絡規劃和配置中欠佳之處,改善和優化網絡的性能;
3.觀察網絡的運行狀況,及時預測網絡通信質量。
網絡故障診斷以網絡原理、網絡配置和網絡運行的知識為基礎。從故障現象出發,以網絡診斷工具為手段獲取診斷信息,確定網絡故障點,查找問題的根源,排除故障,恢復網絡正常運行。網絡故障通常有以下幾種可能:物理層中物理設備相互連接失敗或者硬件及線路本身的問題;數據鏈路層的網絡設備的接口配置問題;網絡層網絡協議配置或操作錯誤;傳輸層的設備性能或通信擁塞問題等。
網絡診斷可以使用包括局域網或廣域網分析儀在內的多種工具:路由器診斷命令;網絡管理工具和其它故障診斷工具。CISCO 提供的工具足以勝任排除絕大多數網絡故障。查看路由表,是解決網絡故障開始的好地方。 ICMP 的 ping、 trace 命令和 Cisco 的 show 命令、 debug 命令是獲取故障診斷有用信息的網絡工具。我們通常使用一個或多個命令收集相應的信息,在給定情況下,確定使用什么命令獲取所需要的信息。譬如,通過 IP 協議來測定設備是否可達到的常用方法是使用 ping 命令。ping 從源點向目標發出 ICMP 信息包,如果成功的話,返回的 ping 信息包就證實從源點到目標之間所有物理層、數據鏈路層和網羅層的功能都運行正常。如何在互聯網絡運行后了解它的信息,了解網絡是否正常運行,監視和了解網絡在正常條件下運行細節,了解出現故障的情況。監視那些內容呢?利用 show interface 命令可以非常容易地獲得待檢查的每個接口的信息。另外 show buffer 命令提供定期顯示緩沖區大小、用途及使用狀況等。Show proc命令和 show procmem命令可用于跟蹤處理器和內存的使用情況,可以定期收集這些數據,在故障出現時,用于診斷參考。網絡故障以某種癥狀表現出來,故障癥狀包括一般性的(象用戶不能接入某個服務器)和較特殊的(如路由器不在路由表中)。對每一個癥狀使用特定的故障診斷工具和方法都能查找出一個或多個故障原因。
二、常見計算機網絡故障的判斷
計算機網絡故障的分類
1、計算機網絡故障的分類雖然有各式各樣的網絡故障,但所有的故障總體可分為物理故障與邏輯故障,也就是通常所說的硬件故障與軟件故障。硬件故障與軟件故障硬件故障有網卡、網線、集線器(Hub)、交換機、路由器等。軟件故障中最常見的情況就是網絡協議問題或因為網絡設備的配置原因而導致的網絡異常或故障。計算機網絡故障判斷步驟
a、首先要檢查網卡是否正常。
b、連接計算機與其他網絡設備的跳線、網線是否暢通,可用測線器檢測。
c、兩邊的RJ-45頭是否插好。
d、信息插座是否有故障。
2、計算機網絡故障的表現癥狀
(1)、連通性故障連通性故障通常表現為以下幾種情況:
a、電腦無法登錄到服務器;
b、電腦無法通過局域網接入 Internet;
c、電腦在“網上鄰居”中只能看到自己,而看不到其他電腦,從而無法使用其他電腦上的共享資源和共享打印機;
d、電腦無法在網絡內實現訪問其他電腦上的資源;
e、網絡中的部分電腦運行速度異常的緩慢。
(2)、故障原因以下原因可能導致連通性故障:
a、網卡未安裝,或未安裝正確,或與其他設備有沖突;
b、網卡硬件故障;
c、網絡協議未安裝,或設置不正確;
d、網線、跳線或信息插座故障;
3、網絡診斷的各種工具
(1)、軟件工具 ping 無疑是網絡中最頻繁的小工具,它主要用于確定網絡的連通性問題。Ping 是 Windows 操作系統集成的 TCP/IP 應用程序之一,可以在“開始-運行”中直接執行Ping 操作
(2) 、診斷的硬件工具可以用此測試儀測試網線的通斷。一般臺站沒有這種設備,但使用起來很簡單,把網線的兩端分別插到測試儀上,打開測試儀的電源,其中有 8 個燈,如果都亮則該網線是通的。如果沒有網絡測試中用三用表測試網線的通斷,只是需要兩個人用兩塊表測試。
三、常見計算機網絡故障的解決方法
解決故障的工作步驟、解決故障
1、網絡故障分層診斷技術
(1)、物理層及其診斷物理層是 OSI 分層結構體系中最基礎的一層,它建立在通信媒體的基礎上,實現系統和通信媒體的物理接口,為數據鏈路實體之間進行透明傳輸,為建立、保持和拆除計算機和網絡之間的物理連接提供服務。
(2)、數據鏈路層及其診斷數據鏈路層的主要任務是使網絡層無須了解物理層的特征而獲得可靠的傳輸。數據鏈路層為通過鏈路層的數據進行打包和解包、差錯檢測和一定的校正能力,并協調共享介質。在數據鏈路層交換數據之前,協議關注的是形成幀和同步設備。2、硬件診斷
(1)、串口故障排除串口出現連通性問題時,為了排除串口故障,一般是從 show interface serial 命令開始,分析它的屏幕輸出報告內容,找出問題之所在。
(2)、以太接口故障排除以太接口的典型故障問題是:帶寬的過分利用;碰撞沖突次數頻繁;使用不兼容的幀類型。使用 show interface ethernet命令可以查看該接口的吞吐量、碰橦沖突、信息包丟失、和幀類型的有關內容等。
四、解決計算機網絡故障的實例
在開始動手排除故障之前,最好先準備一支筆和一個記事本,然后,將故障現象認真仔細記錄下來。在觀察和記錄時一定注意細節,排除大型網絡故障如此,一般十幾臺電腦的小型網絡故障也如此,因為有時正是一些最小的細節使整個問題變得明朗化。一般故障排除模式如下:
第一步,當分析網絡故障時,首先要清楚故障現象。應該詳細說明故障的癥侯和潛在的原因。為此,要確定故障的具體現象,然后確定造成這種故障現象的原因的類型。例如,主機不響應客戶請求服務。可能的故障原因是主機配置問題、接口卡故障或路由器配置命令丟失等。
第二步,收集需要的用于幫助隔離可能故障原因的信息。第三步,根據收集到的情況考慮可能的故障原因。可以根據有關情況排除某些故障原因。第四步,根據最后的可能的故障原因,建立一個診斷計劃。第五步,執行診斷計劃,認真做好每一步測試和觀察,直到故障癥狀消失。