在網(wǎng)絡(luò)的管理運(yùn)維過程中,可以說
故障是不可避免的。如果有管理員企圖打造零故障的網(wǎng)絡(luò),只能是徒勞。因?yàn)榫W(wǎng)絡(luò)故障有太多的隨機(jī)性和偶然性,何況還有人為因素。所以,管理員要做的是掌握網(wǎng)絡(luò)排錯(cuò)技巧,積累經(jīng)驗(yàn)培養(yǎng)敏銳的嗅覺,能夠少走彎路,快速定位并排除故障。筆者做技術(shù)支持時(shí)目睹過不少網(wǎng)管的排錯(cuò)過程,也看過一些別人的排錯(cuò)文章,發(fā)現(xiàn)有不少人有意或者無意地走了不少彎路。下面很大家共享兩(
電腦沒聲音)例網(wǎng)絡(luò)排錯(cuò)案例,希望對朋友們有所啟發(fā)。
案例一:病毒引發(fā)的網(wǎng)絡(luò)故障
故障現(xiàn)象 早上剛上班,用戶打來電話說某個(gè)子網(wǎng)的客戶端無法正常上網(wǎng)。并且反饋信息,在Ping DNS時(shí)斷時(shí)續(xù),遠(yuǎn)程登錄三層交換機(jī),檢查連接用戶辦公樓端口,未發(fā)現(xiàn)有異常情況。
故障診斷 筆者建議管理員首先檢查網(wǎng)絡(luò)是否出現(xiàn)風(fēng)暴或網(wǎng)絡(luò)回環(huán)。打開Sniffer軟件監(jiān)控用戶所在網(wǎng)絡(luò),看是不是出現(xiàn)流量異常的現(xiàn)象,監(jiān)控兩(電腦沒聲音)個(gè)小時(shí)后發(fā)現(xiàn)流量很正常。很奇怪,據(jù)用戶反映在中午下班時(shí)網(wǎng)絡(luò)正常恢復(fù)正常,但是下午用戶又打來電話說網(wǎng)絡(luò)又不正常了,初步判斷問題出在用戶端。
筆者讓管理員到用戶辦公室逐個(gè)排查。根據(jù)用戶反映,如果把網(wǎng)卡禁用后再啟用,網(wǎng)絡(luò)就正常了,但過10分鐘又無法ping通,周而復(fù)始。我們知道,網(wǎng)卡禁用再啟用的過程,就是一個(gè)Arp的學(xué)習(xí)過程,在此期間,它會發(fā)出一個(gè)Arp的請求,詢問誰是這個(gè)網(wǎng)段的網(wǎng)關(guān),然后得到這個(gè)網(wǎng)關(guān)的MAC地址,然后當(dāng)它需要去訪問不同網(wǎng)段機(jī)器的時(shí)候,就會把數(shù)據(jù)包丟給那個(gè)網(wǎng)關(guān)。那么,是不是用戶的某臺機(jī)器中了病毒,導(dǎo)致它可以模仿真實(shí)網(wǎng)關(guān)的地址,使得在局域網(wǎng)內(nèi)的客戶端在上網(wǎng)時(shí)都把數(shù)據(jù)包發(fā)給了這個(gè)模仿真實(shí)網(wǎng)關(guān)的機(jī)器,從而產(chǎn)生故障?馬上找了一臺機(jī)器用arp -a命令去查看這臺機(jī)器默認(rèn)網(wǎng)關(guān)的MAC地址,發(fā)現(xiàn)當(dāng)網(wǎng)絡(luò)正常時(shí)顯示的默認(rèn)網(wǎng)關(guān)的MAC地址是正確的,當(dāng)故障出現(xiàn)時(shí)默認(rèn)網(wǎng)關(guān)的MAC地址突然變了。
故障解決 記下出現(xiàn)故障時(shí)顯示的那個(gè)網(wǎng)關(guān)的MAC地址,然后在樓道交換機(jī)上根據(jù)這個(gè)MAC地址查到是哪個(gè)機(jī)器,拔掉該機(jī)器的網(wǎng)線后,網(wǎng)絡(luò)恢復(fù)正常。至于為何中午下班時(shí)上網(wǎng)正常,是因?yàn)橛脩粝掳鄷r(shí)將中病毒的機(jī)器關(guān)了,所以大家都又能夠正常上網(wǎng)。中毒機(jī)器殺毒后也恢復(fù)正常。
排錯(cuò)總結(jié) 通過對這個(gè)網(wǎng)絡(luò)的故障分析,我們總結(jié)出以下幾點(diǎn):首先是當(dāng)網(wǎng)絡(luò)出現(xiàn)故障的時(shí)候,一定要多到用戶端了解情況,最好能通過用戶對故障的描述抓住網(wǎng)絡(luò)故障的實(shí)質(zhì)。其次,當(dāng)出現(xiàn)奇怪的網(wǎng)絡(luò)現(xiàn)象時(shí),可以分析是否是用戶端的機(jī)器中了病毒導(dǎo)致這種現(xiàn)象發(fā)生,并不一定是網(wǎng)絡(luò)設(shè)備的問題。
案例二:用戶端交換機(jī)環(huán)路引起故障
故障現(xiàn)象 維護(hù)人員發(fā)現(xiàn)7號三層交換機(jī)遠(yuǎn)程無法登錄,初步懷疑設(shè)備故障,于是迅速趕到機(jī)房檢查設(shè)備運(yùn)行情況,設(shè)備供電及其與S8016核心交換機(jī)連接均正常,在交換機(jī)控制口Ping網(wǎng)關(guān)不通;CPU利用率38% ;檢查運(yùn)行日志未發(fā)現(xiàn)有告警。檢查端口,發(fā)現(xiàn)e 0/3流量不正常,輸入流量遠(yuǎn)大于輸出,將e 0/3 Down后,交換機(jī)Ping網(wǎng)關(guān)正常,業(yè)務(wù)恢復(fù)正常,檢查所有端口,只有
三口流量不正常,最后確定是三口所帶的用戶問題,用戶端不停地發(fā)包,流量過大造成三層交換機(jī)上聯(lián)口擁塞,從而影響其他用戶正常上網(wǎng)。
排錯(cuò)過程 到用戶端檢查,將用戶所用的公網(wǎng)IP配置在筆記本電腦上直接上網(wǎng),上網(wǎng)正常,確定用戶端光電轉(zhuǎn)換器和線路無故障。檢查用戶交換機(jī)配置正常,但是只要接上用戶交換機(jī),機(jī)房內(nèi)三層交換機(jī)就無法正常工作,判斷用戶交換機(jī)故障。由于用戶交換機(jī)無資料,無法確定每個(gè)端口的業(yè)務(wù)明細(xì),只有采取將交換機(jī)上的連接線一個(gè)個(gè)拔出,同時(shí)檢查機(jī)房三層交換機(jī)運(yùn)行情況的方法來判斷故障點(diǎn)的位置。當(dāng)將用戶交換機(jī)e 2/8端口線路拔出后,機(jī)房內(nèi)人員報(bào)告三層交換機(jī)運(yùn)行恢復(fù)正常,立刻檢查該線路,發(fā)現(xiàn)這條線路的另一端連接在第e 2/29端口,原來是這條線路兩(電腦沒聲音)端都連接在交換機(jī)上造成環(huán)路,導(dǎo)致鏈路擁塞,用戶無法上網(wǎng)。詳細(xì)檢查發(fā)現(xiàn)造成環(huán)路的端口都未配置,并且沒有業(yè)務(wù)使用,交換機(jī)沒有發(fā)出環(huán)路告警。
排錯(cuò)總結(jié) 故障處理完畢后,總結(jié)分析如下:
(1).用戶交換機(jī)走線雜亂,線路未作標(biāo)簽,業(yè)務(wù)走向不明,是造成環(huán)路故障的主要原因。
(2).由于造成環(huán)路的端口未使用,沒有配置業(yè)務(wù),導(dǎo)致交換機(jī)無法在13志中產(chǎn)生環(huán)路告警,也未能報(bào)告出哪個(gè)VLAN故障。
(3).環(huán)路可造成廣播風(fēng)暴,數(shù)據(jù)流量猛增,造成匯聚設(shè)備上聯(lián)口擁塞,遠(yuǎn)程無法登錄。電腦中ARP病毒后不停發(fā)包,也能造成設(shè)備死機(jī),遠(yuǎn)程無法登錄,兩(電腦沒聲音)種情況有相似之處。
總結(jié):兩(電腦沒聲音)個(gè)簡單的案例,帶給我們不少啟發(fā)。希望管理員朋友們在日常的維護(hù)工作中注意機(jī)房內(nèi)的資料整理,確保線路連接整齊規(guī)范。在處理故障時(shí)多注意觀察三層交換機(jī)日志和端口流量,能有效地減少網(wǎng)絡(luò)故障和處理故障時(shí)間。
網(wǎng)絡(luò)排障少走彎路兩例速解網(wǎng)管疑難