大多數網絡故障緣于硬件:比如電纜、中繼器、Hub、Switch和網卡等。一般來說,可以用二分法隔離、劃分故障在一個小的功能段上,排除最大的簡單段,然后再從一個方便的、靠近問題的點入手確定、排除故障。首先,我們要查找故障的位置。
在查找過程中,一定要沿網段多做幾次測試。如果故障現象隨測試點的不同還保持一樣的話,就可以依照測試結果去排除故障。如果故障現象在一些或所有的測試點都不相同的話,就要把查找故障的方向定在物理故障。例如壞電纜、噪聲、接地循環等。要提高測試質量,在測試的同時要把測試儀器設置成至少可同時發送較低的流量。由于增加了網絡流量,微小的和間歇性的故障會被暴露出來。
在測試網絡前要排除單機故障的可能:
重新冷啟動PC機(熱啟動不能復位全部的適配卡),確認PC機沒有本身的硬件故障,確認所有的網絡電纜都連接正確,確認所有的網卡驅動軟件都正常地裝入,沒有錯誤,確認服務器或服務沒有改變,比如重新配置增加硬件或軟件。
我們經常會遇到下面的網絡故障現象。
不能訪問服務器或某項服務
要先測試一下這一故障是只影響該工作站,還是影響其它站點,可以通過其它工作站登錄服務器或服務來證明這一點。這些工作站要在同一網段或Hub上。如果故障在同一網段或Hub上的其它的站點也存在,就試著從其它的Hub或網段上的站點進行測試。
本地故障
在進行硬件故障查找以前,要確認其它用戶也不能登錄從這臺機器上,這就排除了用戶帳號的錯誤。對一個單一的站點來說,典型的故障多發生在壞電纜、壞網卡、驅動軟件或是工作站設置的不正確等問題上。
全局問題
通常來說,在同軸電纜構架的網中查找故障要用“二分法”來解決。間歇性的故障是比較難以隔離的。
關于電纜
檢查電纜連接性。常用方法就是檢查Hub、收發器以及近期出產的網卡上的狀態燈。如果是10BASE5的電纜,要仔細檢查所有的AUI電纜是否牢固地連接,劃鎖要同時鎖牢,很多問題只要簡單地把未接牢的部分重新緊一下就解決了。
電纜和連接部件受損
在檢查問題時,要注意受損的電纜和連接部件:不正確的電纜類型、未打好的RJ45頭、未按牢的BNC頭等。對懷疑有問題的電纜可以用一般的電纜測試儀或替代法進行測試。
連接接口的正確性
連接接口的不正確,即電纜的接線錯誤可以引起故障。
碰撞問題
如果平均碰撞率大于10%或是觀察到非常高的碰撞,就需要進一步的測試了。如果可能,試著通過減少網段規模(將網絡分成小段)并隨時監測碰撞的變化以隔離出發生問題的區域。為了跟蹤碰撞情況,就必須知道網絡的流量。可以使用背景流量發生器來加入適量的流量(100幀/秒、100字節長的流量),并同時觀察網絡的統計顯示。某些和介質有關的故障是與流量的大小成正比的。可以用控制鍵改變流量同時觀察碰撞與錯誤的改變。在同一網段相距幾尺遠的不同觀察點所看到的情況就不同,要多找幾個點來測試并留意所發生的變化。
如果碰撞與流量成正比,或碰撞幾乎是100%,或幾乎沒有正常的流量,則可能是布線系統出了問題。對于UTP的布線,可以在Hub上斷開電纜然后進行電纜測試。對于同軸纜就要進行阻抗測量,可以使用數字表或其他儀表的直流通斷功能進行測試。
利用率過高
如果利用率過高(平均值大于40%,瞬時峰值高于60%),那么網段負荷就過重了。應當考慮安裝網橋或路由器以減少在網段中的流量或把網段分成若干小的網段。
客戶服務器的連接
連通性
使用專業儀表,你可以運行Server List或Novell Ping測試功能,用來驗證從測試點是否可以訪問服務器或服務功能。如果服務器沒有回應,重新冷啟動服務器并注意觀察所有所需的驅動軟件是否正確加載,有無錯誤提示。另外,也可對服務器進行幾次Ping測試,要確認請求信號與返回的響應信號數目相等,結果不一致則表明有時好時壞的網卡或Hub的故障導致幀的丟失。臨界狀態的和已壞的橋或路由器也可以用此方法很快地定位。
服務器或服務的可達性
如果使用協議分析儀,就要捕獲3至4分鐘的數據包來分析。看一下是否有從服務器發出延時請求,并找出是哪個服務器,如果有延時請求,則表明服務器不能完全處理所加載的任務,每一個延時請求作廢一個任務請求。
新聞熱點
疑難解答