1. 必看干貨!網路排錯思路 大總結~
轉自51CTO:xpleaf
blog.51cto.com/xpleaf/1689438
明人不說暗話,這篇文章我們來聊一個非常有用,同時也是程序員必備的技能, 那就是網路排錯思路大總結。
有了這個技能,如果以後發生領導、妹子電腦上不了網的情況,你上去就是一頓操作,穩穩的~~
網 絡排錯的必備條件
為什麼要先講必備條件?因為這里所講的網路排錯並不僅僅是停留在某一個小小命令的使用上,而是一套系統的方法,如果沒有這些條件,真的不能保證下面聊的這些可以聽得懂,並且能運用到實際當中,所以還是先看看這些基礎的條件吧。
1.1 熟悉OSI七層模型與TCP/IP協議棧
這應該是網路排錯要知道的最基本的知識了。
無論是OSI七層模型還是DoD模型,都是用來描述網路通信的一個過程,以讓我們對網路數據的發送和接收有一個大致的認識。OSI七層模型對應OSI七層模型的協議,DoD模型對應DoD模型的協議,也就是TCP/IP協議棧。
TCP/IP協議棧裡面的協議就顯得十分重要了,比如DNS、TCP、UDP、IP、ICMP、ARP,這些最基本的應該得知道吧,我們不需要像《TCP/IP協議棧》中說得的那麼細,但至少,對於這些協議的基本功能我們是必須得要知道的,這些就不是一兩句可以說清楚的了,計網里也都學了~
1.2 了解網路通信的基礎設備和其對應的OSI層次
像交換機、三層交換機、路由器、防火牆這些最基本的網路設備應該要有些了解,尤其是它們對應的OSI層次以及作用,比如普通的二層交換機對應OSI七層模型中的數據鏈路層,它可以隔絕沖突域,同時可以通過虛擬區域網技術(VLAN)來隔絕廣播域,二層交換機通過二層地址即MAC地址來實現數差鍵握據幀的轉發;再比如路由器,它對應網路層,可以提供路由定址的功能等等。
1.3 了亮備解中小型企業網路的基本架構
一般中小型企業網路的基本架構都是這樣的:接入層--匯聚層--核心層--網路出口。
下面給個圖:
如果網路環境比較龐大,匯聚層和核心層都會有,像這里的話,就直接沒有匯聚層,不過思想是一樣的。下面講的排錯其實都是針對用戶PC來說明的,事實上,數據中心中的網路排錯也是類似的。不管網路環境多麼復雜,其實簡化下來跟這個都是差不多的。
1.4 知道常用的網路排錯命令
如果用戶使用的是Windows操作系統,那麼下面的這些命令就很重要了:
如果使用的是Linux操作系統,那麼也有對應的相關命令。其實說到底就是要熟悉你所使用的設備,當然,在實際網路排錯的過程中,如果只是為了測試網路通信是否正常,你可以換上你熟悉的設備操作。
1.5 清楚知道網路排錯的一個重要原則
網路排錯,不就是要判斷網路哪裡出了問題,因此,你就必須要知道數虛慶據的走向。
所以一個重要原則是: 關注數據的走向。
下面講的網路排錯思路其實就是通過追蹤數據的走向來一步步縮小網路故障點的,因此,時刻記住這一點非常非常重要!這也是為什麼上面需要讓你了解中小型企業網路的基本架構了。
網 絡排錯的基本思路
基本思路如下,這跟網上的大多數人寫的應該是差不多的。
(1)檢查物理鏈路是否有問題
(2)查看本機IP地址、路由、DNS的設置是否有問題
(3)測試網關或路由器的通暢情況。先測網關然後再測路由器,一級一級地測試
(4)測試ping公網ip的通暢情況(平時要記幾個外部IP)
(5)測試DNS的通暢情況,可以直接ping網站地址
網 絡排錯的具體步驟
為了更好的講述網路排錯的過程和思路,假設我們有下面的一個網路環境:
(說明:雖然是假設,但實際上該網路環境是通過GNS3聯動虛擬機和真實網路架設起來的,所以是可以真實參考的)
下面,我們就以上面這個網路環境為例子,詳細介紹我們的網路排錯思路,每一步要怎麼做,每一步為什麼要這樣做以及這樣做之後我們可以得到什麼信息,都會做一個說明。
3.1 檢查物理鏈路是否有問題
這一步是我個人認為在做網路排錯時必須要做的第一步!經常會聽朋友說,領導的電腦上不了網,需要過去排錯,搞了老半天,還發現不了問題,最後在幾經絕望之時,竟然發現網線都沒接上電腦。這就真的是悲劇了,浪費了很多時間不說,這樣的網路排錯思路本來就是有錯誤的。
因為也許不是每個人都可以去機房查看交換機的接線情況,所以這一步,我們排查的重點范圍就應該放在如下面圖所示的地方:
在這一步,下面幾點是需要注意排查的:
1. 確認電腦本身的網卡有沒有問題
2. 確認接的網線有沒有問題
3. 本機所連接的交換機(如果可以去機房查看的話)
如果上面這幾點排查都沒有問題了,那麼就是該網路環境中的其他設備問題了。這一范圍的排查相對比較簡單,因為只涉及到物理鏈路的連接問題。
對於這種測試,可以考慮使用測線器,但個人的建議是,拿一台配置正確的筆記本來做測試也未嘗不可。
3.2 查看本機IP地址、路由、DNS的設置是否有問題
上面第一步,物理鏈路的排查沒有問題了,也就是說,電腦接上網線之後,電腦有反應了,可以識別,但是網路還是不通,來到這一步,就應該先把注意的范圍放在電腦的設置上面了。
這一步,我們關注的重點是:
1. IP地址設置
如果採用的是DHCP自動獲取的方法,那麼這時候只需要看自己本機的設置上有沒有開啟自動獲取IP的設置以及有沒有開啟相關的服務;
如果用的是靜態IP,那麼就必須要注意IP地址的填寫有沒有錯(一般網路管理人員給的)、IP地址的子網掩碼有沒有問題(這很重要,對於靜態IP,很多人在這里設置錯誤,建議是,最好把IP地址、VLSM這方面的知識學一下)。
一般可以用下面的命令查看:
2. 路由設置
對於伺服器、PC,一般是指默認網關的設置了;對於路由器本身或三層交換機,那就是靜態路由或動態路由的設置問題了。
3. DNS設置
主要是要確保所設置的DNS伺服器地址到底有沒有提供域名解析服務或者是否出現了故障,至於如何判斷,後面會給出方法,這里關注的是,你得設置一個正確的DNS伺服器地址或可以自動獲取。在windows上面你可以通過下面的命令查看:
3.3 測試網關或路由器的通暢情況。先測網關然後再測路由器,一級一級地測試
在上面的網路環境中,在網路通的情況下,我們在電腦上使用命令tracert -d命令,會得到下面的結果:
通過這個測試結果,我們可以清楚地知道電腦在訪問互聯網時,數據的走向情況:
根據這個數據走向,我們就可以得到一個重要的思路,就是根據數據走向來檢測網路的通暢情況!因此,我們可以分兩步:
1. 先測試電腦到網關192.168.2.254的通暢情況
我們可以在自己的電腦上自己ping網關的地址,看是否有響應
一般這樣的判斷方法是比較快的,但有時候,無論怎樣ping都不能,那麼則可能有以下的幾種情況:
a. 網關設備做了禁止ping的設置
b. 網關介面或網關設備出現故障
對於a,一般很少會在這些設備在做ping的限制操作,實在是沒有太大的必要這樣做,當然,網路安全等要求十分嚴格的除外。ping通192.168.2.254網關後,再ping一下172.16.13.1以確認電腦到整個網關設備都沒有問題。
對於ping不通的時候,我個人還建議在電腦上執行如下操作:
即查看電腦本身有沒有獲取到網關的MAC的地址,顯然,如果沒有網關的MAC地址,那也是不可能ping通網關的,在排除了前面電腦設置的問題後,你可以猜測是網關設備出了問題,這時就可以聯系網路工程師對網關設備進行測試了。
2. 測試到其它路由器的通暢情況
前面一步沒有問題了,也就是電腦到網關通信正常了,再測試網關到出口路由器的通暢情況:
這里,我們使用tracert -d命令就可以了:
當然,如果發現不通,那麼則可能是下面的情況:
a. 網關設備與路由器之間的物理鏈路問題
b. 網關設備與路由器之間的設置問題,比如路由協議、介面配置之類的
出現上面的情況,那就是網路工程師的問題了,當然,如果你是網路工程師,應該要馬上查看一下設備的狀態,看是不是設備哪裡出現問題了。
上面的步驟完成了,假設你的出口路由器設置是沒有問題的,比如NAT與默認路由等的設置,那麼我們大致可以知道,內網的一個基本通信是正常的(至少你的電腦和出口路由器的通信沒問題),我們就要看看電腦到底能不能訪問互聯網了。
3.4 測試ping公網ip的通暢情況(平時要記幾個外部IP)
來到這一步的時候,就說明前面三步是沒有問題的,也就是說,本地區域網絡的通信是正常的,這時要做的就是判斷本地區域網絡與外網(公網)之間的通信有沒有問題了:
這里採取的是直接ping公網地址的方法,是為了排除DNS的影響(萬一你的DNS設置又有問題),至於要ping什麼樣的公網地址,個人建議是,可以ping一些沒有禁止ping的公共DNS伺服器地址,比如114.114.114.114和8.8.8.8的:
這樣之後,基本上就可以確定網路是沒有問題的了。當然,這里並沒有提到出口放置防火牆的情況,實際上,思路是一致的,但是,你需要考慮的是,你的訪問數據有沒有被防火牆給過濾掉,是數據出去的時候過濾了,還是數據回來的時候過濾了?由於還要涉及到防火牆的設置,這里就不再提及了,只是仍要注意這一點就是了。
3.5 測試DNS的通暢情況,可以直接ping網站地址
如題,可以直接ping網站地址,看有沒有回顯IP地址,至於通不通是另外一回事,只要可以回顯IP地址,那麼DNS就沒有問題了,不過這里仍然要說一下nslookup這個命令,這是一個非常好用的命令,我平常自己在網路排錯時,基本上都會用到:
當然也可以像下面這樣使用:
使用nslookup命令,作用有二:
1.幫你測試你設置的DNS伺服器有沒有問題
2.在不考慮DNS伺服器是否智能的前提下,你可以根據回顯IP地址速度的快慢來大致判斷DNS伺服器的優劣情況
所以可以充分利用nslookup命令了。
最後重要說明
其實基本上,一個相對完整的網路排錯過程就應該如上面所說的了,不過,是基本上的,因為上面的講解,都幾乎是假定你是沒有許可權進入機房查看網路設備的情況的。
事實上,你是根本不需要照搬來進行上面的全部步驟的,在實際排錯的過程中,可能你用到的只是其中的一小部分而已,畢竟,如果每次都這樣下來,沒有誰是不會瘋掉的,因為一些很簡單的問題也要這樣折騰,那就是太浪費時間了!但是,上面的方法,只是提出一種網路排錯的思路,希望按照這個思路可以判斷出網路的問題出現在哪裡,至於如何去解決,這中間真的又涉及到太多太多的經驗問題。其實整個下來,個人覺得,最重要的仍然不是技術本身,而是在網路排錯過程當中的一個思路,思路決定出路,這可以讓自己在網路排錯的過程中時刻保持清醒的頭腦,這一點很重要。
2. 網路故障排查方法有哪些
1. 從客戶端電腦著手
當有用戶報告出現網路問題時,應該首先從該用戶的電腦開始檢查,會讓整個排錯過程變得更容易。
可以讓用戶嘗試訪問一些常用的網站,如網易、新浪、網路等,如果用戶表示訪問正常,再通過鏡像盤符訪問內網的資源。通過以上客戶端的操作,可以幫助我們判斷到底是客戶端的問題還是伺服器的問題。
2. 縮小客戶端問題范圍
如果用戶無法訪問網路,可以讓其嘗試使用相鄰的其它電腦。如果另一台電腦網路正常,那麼問題肯定就出在客戶端電腦上了。
接下來要確認的就是客戶端電腦的物理連接部分。讓用戶通過連接無線網路的方式確定有線網路的硬體和連接部分是否有問題,或者重啟系統進入安全模式,排除惡意軟體的干擾。
如果客戶端電腦看上去沒什麼問題,再讓用戶通過筆記本電腦接入網路,查看是否是網線或水晶頭問題。如果問題只集中在一台電腦,並且是採用無線網路連接的,那麼可以確定無線網卡是開啟狀態的。
事實上,很多筆記本電腦為了節省電力,都能夠單獨關閉無線網卡。而用戶很可能不小心關閉了無線網卡,這種情況吧也是較為常見的。
3. 排查交換機和路由器
排除了客戶端的問題後,我們來排查交換機和路由器。
如果之前的電腦能順利工作,但是換了一台新電腦,通過相同網線卻上不了網,那麼排出新客戶端配置問題後,問題很可能就出在交換機部分。因此要繼續檢查交換機、路由器以及數據機等設備。對於較小的客戶端網路環境或DSL連接方式,這個檢查很有必要。而且通過電話進行排錯指導時,這一步檢查也很方便。
可以通過電話指導用戶關閉路由器、交換機和DSL數據機的電源,再將他們打開,檢查網路是否恢復正常。
如果還不正常,可以讓用戶重復上面的關閉和啟動工作,同時再加上重啟客戶端電腦(解決DHCP可能存在的問題)。
如果問題還沒有排除,那麼問題可能就出在為客戶端提供網路服務的供應商那邊。可以自己聯系網路供應商或者讓用戶聯系網路供應商。如果網路供應商反饋網路正常,那麼就需要你對客戶端一側做更進一步的檢查了。
4. 檢查伺服器
如果是整個公司的電腦都無法使用區域網(當然也包括廣域網),那麼懷疑的重點應該是伺服器。
首先要做的是登錄伺服器,打開瀏覽器,嘗試訪問常用門戶網站,如果無法訪問,就需要進一步對伺服器進行檢查。
可以讓用戶禁用後再啟用網路,一般需要做兩次,一次是針對內網介面,另一次則是針對外網介面。在網路介面重新啟用後,再嘗試訪問互聯網,並通過客戶端電腦嘗試訪問網站。如果還不成功,就需要進一步研究了。
5. 重啟伺服器
首先確定用戶公司已經沒有員工在使用伺服器上的資源了,甚至可以讓該公司所有客戶端電腦暫時關閉。
這一步完成後,你可以提醒用戶,伺服器重啟完畢需要15到30分鍾,在伺服器最終啟動完畢後,可以讓出現故障的終端啟動,檢查之前的故障是否已經排除。如果故障還沒排除,你就應該起身前往故障現場了。
3. 計算機網路故障判斷與排查分析
計算機網路故障判斷與排查分析
要想搞好網路的運轉管理和故障診斷工作,就必須提高故障診斷水平,認真學習有關網路技術理論,清楚網路的結構設計,熟悉常用的診斷工具,准確的描述故障現象。以下是我分享的計算機網路故障判斷與排查分析論文,歡迎閱讀借鑒。
摘要: 計算機網路故障診斷是從事計算機網路管理的一項重要技術工作,解決網路故障,可以發揮網路的最大作用。本文主要介紹了計算機網路故障判斷步驟以及幾種故障排除策略。
關鍵詞: 計算機;故障;網路;排除策略
一、前言
隨著計算機網路的發展,網路之間的連接越來越復雜,計算機網路發生故障是不可避開的。網路故障診斷的目的就是為了確定網路故障的部位,使網路恢復正常運轉。
二、計算機網路故障判斷步驟
(1)首先要檢查網卡是否正常。每塊網卡都帶有LED指示燈,位置一般在主機箱的背面,綠燈表示連接正常,有的綠燈和紅燈都要亮,紅燈表示連接故障,不亮表示無連接或線路不通。根據數據流量的大小,指示燈會時快時慢的閃爍。正常情況下,在不傳送數據時,網卡的指示燈閃爍較慢,傳送數據時,閃爍較快。
(2)連接計算機與其他網路設備的跳線、網線是否暢通。網路連線的故障通常包括網路線內部斷裂、雙絞線、RJ-45水晶頭接觸不良,可用測線器檢測。還要檢查兩邊的RJ-45頭是否插好,以及信息插座是否有故障。
三、計算機網路連通性故障排除策略
(1)確認連通性故障
當出現一種網路應用故障時,如無法接入Internet,首先嘗試使用其他網路應用,如查找網路中的其他電腦,或使用區域網中的Web瀏覽等。如果其他網路應用可正常使用,如無法接入Internet,卻能夠在“網上鄰居”中找到其他電腦,或可ping到其他電腦,即可排除連通性故障理由。如果其他網路應用均無法實現,繼續下面操作。
(2)看LED燈判斷網卡的故障
首先查看網卡的指示燈是否正常。正常情況下,在不傳送數據時,網卡的指示燈閃爍較慢,傳送數據時,閃爍較快。無論是不亮,還是長亮不滅,都表明有故障存在。如果網卡的指示燈不正常,需關掉電腦更換網卡。對於Hub的指示燈,凡是插有網線的'埠,指示燈都亮。由於是Hub,所以,指示燈的作用只能指示該埠是否連接有終端設備,不能顯示通信狀態。
(3)判斷是否是Hub和雙絞線的理由
如果確定網卡和協議都正確的情況下,還是網路不通,可初步斷定是Hub和雙絞線的理由。為了進一步進行確認,可再換一台電腦用同樣的策略進行判斷。如果其他電腦與本機連接正常,則故障一定是先前的那台電腦和Hub的介面上。
如果確定Hub有故障,應首先檢查Hub的指示燈是否正常,如果先前那台電腦與Hub連接的介面燈不亮說明該Hub的介面有故障(Hub的指示燈表明插有網線的埠,指示燈亮,指示燈不能顯示通信狀態)。
通過上面的故障壓縮,我們就可以判斷故障出在網卡、雙絞線或Hub上。
四、計算機協議故障排除策略
(1)協議故障的表現
協議故障通常表現為以下幾種情況:
①電腦無法登錄到伺服器。
②電腦在“網上鄰居”中既看不到自己,也無法在網路中訪問其他電腦。
③電腦在“網上鄰居”中能看到自己和其他成員,但無法訪問其他電腦。
④電腦無法通過區域網接入Internet。
(2)故障理由分析
協議故障理由通常有以下二種情況:
①協議未安裝:實現區域網通信,需安裝NetBEUI協議。
②協議配置不正確:TCP/IP協議涉及到的基本參數有四個,包括IP地址、子網掩碼、DNS、網關,任何一個設置錯誤,都會導致故障發生。
(3)排除步驟
當電腦出現以上協議故障現象時,應當按照以下步驟進行故障的定位:
①檢查電腦是否安裝TCP/IP和NetBEUI協議,如果沒有,倡議安裝這兩個協議,並把TCP/IP參數配置好,然後重新啟動電腦。
②使用ping命令,測試與其他電腦的連接情況。
③在“制約面板”的“網路”屬性中,單擊“文件及列印共享”按鈕,在彈出的“文件及列印共享”對話框中檢查一下,看看是否選中了“允許其他用戶訪問我的文件”和“允許其他電腦使用我的列印機”復選框,或者其中的一個。如果沒有,全部選中或選中一個。否則將無法使用共享文件夾。
④系統重新啟動後,雙擊“網上鄰居”,將顯示網路中的其他電腦和共享資源。
五、計算機配置故障排除策略
(1)配置故障表現及分析
配置故障更多的時候是表現在不能實現網路所提供的各種服務上,如不能訪問某一台電腦等。因此,在修改配置前,必須做好原有配置的記錄,並最好進行備份。配置故障通常表現為以下幾種:①電腦只能與某些電腦而不是全部電腦進行通信;②電腦無法訪問任何其他設備。
(2)配置故障排錯步驟
首先檢查發生故障電腦的相關配置。如果發現錯誤,修改後,再測試相應的網路服務能否實現。如果沒有發現錯誤,或相應的網路服務不能實現,我們就需要測試系統內的其他電腦是否有類似的故障,如果有同樣的故障,說明理由出在網路設備上,如Hub。反之,檢查被訪問電腦對該訪問電腦所提供的服務作認真的檢查。
六、結束語
要想搞好網路的運轉管理和故障診斷工作,就必須提高故障診斷水平,認真學習有關網路技術理論,清楚網路的結構設計,熟悉常用的診斷工具,准確的描述故障現象。
參考文獻
[1]肖文軍.淺析計算機網路故障分析及維護[J].電腦知識與技術,2009(18).
[2]藍峰.淺談計算機網路常見故障處理及維護策略[J].矽谷,2009(03).
;