時間:2015/6/28來源:IT貓撲網(wǎng)作者:網(wǎng)管聯(lián)盟我要評論(0)
能不能期望我們每一位網(wǎng)管員都能夠解決網(wǎng)絡(luò)運行中出現(xiàn)的所有問題呢?通過多年網(wǎng)絡(luò)管理的總結(jié)認為,如果預(yù)先采取一定的措施,并且使用正確的故障診斷方法,那么回答是肯定的。下面給出了一個較為完整的過程,敬請各位同行批評指正。
及時更新網(wǎng)絡(luò)圖
首先應(yīng)該繪制一個網(wǎng)絡(luò)方框圖。這個文檔的作用是為從事故障診斷的人員提供一個關(guān)于網(wǎng)絡(luò)布局和配置的全部信息的單一來源。網(wǎng)絡(luò)圖上包含的主要內(nèi)容有:
●路由器的連接圖;
●設(shè)備的序號、型號及端口情況;
●使用的路由協(xié)議(如RIP、OSPF等);
●IOS版本(用于具有何種性能查找和判別);
●已安裝的模塊;
●訪問控制列表;
●地址(網(wǎng)絡(luò)地址和序號,MAC地址更好);
●交換機(型號);
●集線器(Hub型號);
●所有配置的拷貝。
當(dāng)網(wǎng)絡(luò)使用發(fā)生變化時,要及時更新網(wǎng)絡(luò)圖。如果沒有更新網(wǎng)絡(luò)圖,那么您的網(wǎng)絡(luò)圖的用處就要大打折扣,這將是非常危險的。如果出現(xiàn)這種情況,您必須馬上繪制一幅新的網(wǎng)絡(luò)圖,而不是依賴那個不能反映實際情況的老的網(wǎng)絡(luò)圖。
當(dāng)網(wǎng)絡(luò)以通常方式運行時,必須符合網(wǎng)絡(luò)性能的基線;用來記錄網(wǎng)絡(luò)在低、中和高使用量時的信息量。它建立了一個網(wǎng)絡(luò)運行性能的記錄,該記錄可以用來進行比較,以確定是否出現(xiàn)問題。網(wǎng)絡(luò)運行性能基線中包含以下主要內(nèi)容:
●網(wǎng)絡(luò)上運行了哪些協(xié)議;
●每個協(xié)議使用的帶寬百分比;
●每個協(xié)議的峰值使用量和平均使用量;
●數(shù)據(jù)包的大小以及每種大小數(shù)據(jù)包的百分比;
●循環(huán)冗余校驗(Cyclical Redundancy Check,CRC)發(fā)現(xiàn)的錯誤的峰值和平均值;
●網(wǎng)段每秒鐘傳輸?shù)男畔姆逯岛推骄担?br /> ●是否存在超長的數(shù)據(jù)包;
●沖突域每秒產(chǎn)生的沖突的峰值和平均值;
●網(wǎng)段運行的峰值和平均值。
故障診斷方法與步驟
正確地確定問題是解決問題的關(guān)鍵。下面我們按照順序介紹故障診斷方法、步驟。應(yīng)該注意的是這些步驟往往是相互重疊的,而且解決問題的方法實質(zhì)上是循環(huán)式的。
⑴確定網(wǎng)絡(luò)問題的性質(zhì);
⑵收集有關(guān)的情況并對問題進行分析;
⑶分析問題產(chǎn)生的原因;
⑷設(shè)計一個解決問題計劃;
⑸實現(xiàn)這個解決問題計劃;
⑹評估該解決問題計劃產(chǎn)生的結(jié)果;
⑺重復(fù)上面的操作,直到問題得到解決;
⑻將解決方案記入文檔資料。
確定網(wǎng)絡(luò)問題的性質(zhì)實際上就是要提出問題。即"誰出了問題,是什么問題,何時產(chǎn)生和出現(xiàn)在何處"這樣的形式。這些問題可能會多次出現(xiàn),您可以向用戶、網(wǎng)管員、以及遇到或者了解問題的其他人詳細提問:誰受到了問題的影響?是單個用戶還是存在共性的一組用戶,甚至是整個網(wǎng)絡(luò)中的所有用戶呢?
若是單個用戶可能出現(xiàn)下列若干問題中之一:
●物理層問題,包括發(fā)生故障的網(wǎng)絡(luò)電纜。可用Ping來測試;
●在特定主機上的硬件故障。用Ping 127.0.0.1或Ping本機地址來檢測;
●軟件加載不正確或者崩潰了,尤其是網(wǎng)絡(luò)協(xié)議出了問題?芍匮b軟件或刪除網(wǎng)絡(luò)協(xié)議后重新加載網(wǎng)絡(luò)協(xié)議;
●主機地址或者子網(wǎng)掩碼設(shè)置不正確。可修正主機地址和子網(wǎng)掩碼;
●默認網(wǎng)關(guān)配置不正確。可用Tracert檢測,重新修正默認網(wǎng)關(guān)。
擁有公共屬性或者遇到問題的一組用戶可能出現(xiàn)下列若干問題:
●網(wǎng)絡(luò)設(shè)備(比如集線器或者交換機)發(fā)生了故障;
●路由器接口發(fā)生故障;
●服務(wù)器發(fā)生故障;
●訪問列表設(shè)置錯誤;
●VLAN配置錯誤。
在我們知道"誰出了問題"后,就要集中精力解決:這個問題有何表現(xiàn)?是沒有連接還是只有部分連接的問題,或者是根本沒有連接的問題呢?如果是沒有連接的問題,那它就屬于:
●硬件故障;
●遠程通信服務(wù)故障;
●路由協(xié)議故障。
如果是部分連接的問題,那它屬于;
●訪問列表問題;
●子網(wǎng)掩碼不正確;
●路由協(xié)議不兼容。
這個問題何時發(fā)生呢?是間歇性出現(xiàn)還是經(jīng)常發(fā)生的問題,或者是剛剛發(fā)生的問題呢?
如是間歇性發(fā)生的問題,其原因可能是:
●遠程通信服務(wù)故障;
●信息擁擠;
●路由循環(huán)。
如是經(jīng)常發(fā)生的問題,那么原因是信息擁擠。出現(xiàn)新問題的原因是:
●訪問列表發(fā)生變化;
●新的硬件故障;
●路由協(xié)議發(fā)生變化;
●新增加的路由。
正確確定網(wǎng)絡(luò)問題的性質(zhì),是我們判斷是廣域線路問題還是局域網(wǎng)中的問題的基礎(chǔ)。
解決故障步驟
收集有關(guān)的情況并對問題進行分析
主要包括對設(shè)備進行觀察,設(shè)法了解問題究竟存在什么位置?梢酝ㄟ^查看路由器的接口和進程命令,查看內(nèi)存、緩存和CPU的使用情況等等。在查看過程中,應(yīng)記錄發(fā)現(xiàn)的情況,以便評估存在問題的原因。如遇到間歇性失去連接的問題,注意查看該接口復(fù)位了多少次。如果問題與訪問列表相關(guān),就需要查看訪問列表是如何設(shè)置的,與現(xiàn)有文檔的注釋進行比較,判斷是否一致。如現(xiàn)有的設(shè)置與文檔不一致,應(yīng)審查更新文檔的策略。在盡可能收集到各種情況后,即可轉(zhuǎn)入對問題原因的分析工作。
分析產(chǎn)生問題的原因
就是要確定這個問題本身有什么表現(xiàn),誰受到了這個問題的影響。如果我們不知道這個情況,就需要倒退一個或兩個步驟,重新思考這個問題。如果收集到正確的信息,那么在解決問題模型中,這是最容易執(zhí)行的步驟之一。知道誰受到了問題的影響,這個問題有何表現(xiàn),問題在何時發(fā)生,以及問題發(fā)生在何處。剩下的唯一問題就是這個問題為何會發(fā)生。當(dāng)我們對OSI模型有一個透徹的了解時,解決這個問題對故障診斷者來說就變得易如反掌了。因此要求我們對OSI模型的每一層協(xié)議功能要非常熟悉,才能從中獲得重要的線索,以確定問題為何會發(fā)生。
當(dāng)您認為問題的原因已經(jīng)找到后,應(yīng)該再花一點時間來確定其他還有什么原因?qū)е聠栴}的產(chǎn)生。您應(yīng)該避免只找出單個原因。只有找到確定的原因越多,您解決問題的可能性就越大。因此要盡量找出可能的故障原因,按降序列出導(dǎo)致故障的可能原因,并從中找出最有可能的故障原因。
設(shè)計解決問題計劃
只有當(dāng)確定了導(dǎo)致問題產(chǎn)生的最有可能的原因時,才能制定一個操作計劃。包括為了解決問題而計劃使用的操作步驟。在確定操作步驟時。應(yīng)盡量做到詳細;這個計劃越詳細,按照這個計劃執(zhí)行的可能性就越大。一旦制定好計劃,就要按步驟實施這個計劃。
實施解決問題計劃
當(dāng)在實施操作計劃時,以特別注意,每次只能作一個修改。如果修改后問題解決,那么應(yīng)該將修改的結(jié)果進行分析并記入文檔。如果修改沒有成功,應(yīng)該立即撤消這個修改。重要的是要按照制定的計劃來進行操作。因為在實施計劃中,有時由于某一步不行,很容易嘗試新的方法。這樣做的危害是很快就失去對原計劃的跟蹤線索,結(jié)果往往使情況變得更加槽糕。一旦發(fā)現(xiàn)原計劃不可行,正確的方法是應(yīng)該重新設(shè)計計劃,然后實施新的計劃。
另外,在實施操作計劃時,應(yīng)特別注意安全程序的執(zhí)行。安全性是我們最擔(dān)心的事情。不要或者盡量少開放網(wǎng)絡(luò),在解決問題時,也應(yīng)該盡可能縮短放松安全性的時間。前者可以阻止不太精明黑客突破網(wǎng)絡(luò)的企圖,后者可以減少黑客在在網(wǎng)絡(luò)安全性放松時攻擊網(wǎng)絡(luò)的可能性。
評估操作計劃產(chǎn)生的結(jié)果
觀察結(jié)果最簡單的方法是用第一步中獲得的數(shù)據(jù)來測試。問題的表現(xiàn)或者某些表現(xiàn)是否仍然存在呢?如在第一步中簡明說明了存在的問題,那么就可以較容易地測定問題地表現(xiàn)是否存在。如果問題的某些表現(xiàn)已經(jīng)解決,但其他的表現(xiàn)仍然存在,那么將解決方案記入文檔,然后轉(zhuǎn)入下一個操作步驟。
間歇性問題的測試并不是那么容易進行。有時要等到發(fā)生另一個故障時才能進行測試。在這種情況時,在最終確定問題之前,必須把對系統(tǒng)的修改記入文檔,這是非常重要的。
重復(fù)操作過程
在完美無缺的環(huán)境中,根本
關(guān)鍵詞標簽:診斷,故障,措施,采取,
相關(guān)閱讀
熱門文章 提示dns服務(wù)錯誤怎么辦 dns錯誤問題多種解決IS-IS同時下發(fā)缺省路由出現(xiàn)路由環(huán)路問題的解IBGP鄰居無法建立連接問題的解決方法對稱結(jié)構(gòu)承載網(wǎng)流量出現(xiàn)異常問題的故障解決
人氣排行 光纖上網(wǎng) 路由器設(shè)置頁面進不去怎么辦登錄SSH服務(wù)器失敗問題的分析及解決無線網(wǎng)卡連接不上怎么辦_無線網(wǎng)卡連接不上解決方法提示dns服務(wù)錯誤怎么辦 dns錯誤問題多種解決方法本機IP設(shè)置不當(dāng)造成路由異常故障分析路由設(shè)置不當(dāng) 導(dǎo)致VPN無法訪問外網(wǎng)無線路由器無不能上網(wǎng)的秘密ADSL頻繁掉線如何解決?