1. 必看干货!网络排错思路 大总结~
转自51CTO:xpleaf
blog.51cto.com/xpleaf/1689438
明人不说暗话,这篇文章我们来聊一个非常有用,同时也是程序员必备的技能, 那就是网络排错思路大总结。
有了这个技能,如果以后发生领导、妹子电脑上不了网的情况,你上去就是一顿操作,稳稳的~~
网 络排错的必备条件
为什么要先讲必备条件?因为这里所讲的网络排错并不仅仅是停留在某一个小小命令的使用上,而是一套系统的方法,如果没有这些条件,真的不能保证下面聊的这些可以听得懂,并且能运用到实际当中,所以还是先看看这些基础的条件吧。
1.1 熟悉OSI七层模型与TCP/IP协议栈
这应该是网络排错要知道的最基本的知识了。
无论是OSI七层模型还是DoD模型,都是用来描述网络通信的一个过程,以让我们对网络数据的发送和接收有一个大致的认识。OSI七层模型对应OSI七层模型的协议,DoD模型对应DoD模型的协议,也就是TCP/IP协议栈。
TCP/IP协议栈里面的协议就显得十分重要了,比如DNS、TCP、UDP、IP、ICMP、ARP,这些最基本的应该得知道吧,我们不需要像《TCP/IP协议栈》中说得的那么细,但至少,对于这些协议的基本功能我们是必须得要知道的,这些就不是一两句可以说清楚的了,计网里也都学了~
1.2 了解网络通信的基础设备和其对应的OSI层次
像交换机、三层交换机、路由器、防火墙这些最基本的网络设备应该要有些了解,尤其是它们对应的OSI层次以及作用,比如普通的二层交换机对应OSI七层模型中的数据链路层,它可以隔绝冲突域,同时可以通过虚拟局域网技术(VLAN)来隔绝广播域,二层交换机通过二层地址即MAC地址来实现数差键握据帧的转发;再比如路由器,它对应网络层,可以提供路由寻址的功能等等。
1.3 了亮备解中小型企业网络的基本架构
一般中小型企业网络的基本架构都是这样的:接入层--汇聚层--核心层--网络出口。
下面给个图:
如果网络环境比较庞大,汇聚层和核心层都会有,像这里的话,就直接没有汇聚层,不过思想是一样的。下面讲的排错其实都是针对用户PC来说明的,事实上,数据中心中的网络排错也是类似的。不管网络环境多么复杂,其实简化下来跟这个都是差不多的。
1.4 知道常用的网络排错命令
如果用户使用的是Windows操作系统,那么下面的这些命令就很重要了:
如果使用的是Linux操作系统,那么也有对应的相关命令。其实说到底就是要熟悉你所使用的设备,当然,在实际网络排错的过程中,如果只是为了测试网络通信是否正常,你可以换上你熟悉的设备操作。
1.5 清楚知道网络排错的一个重要原则
网络排错,不就是要判断网络哪里出了问题,因此,你就必须要知道数虚庆据的走向。
所以一个重要原则是: 关注数据的走向。
下面讲的网络排错思路其实就是通过追踪数据的走向来一步步缩小网络故障点的,因此,时刻记住这一点非常非常重要!这也是为什么上面需要让你了解中小型企业网络的基本架构了。
网 络排错的基本思路
基本思路如下,这跟网上的大多数人写的应该是差不多的。
(1)检查物理链路是否有问题
(2)查看本机IP地址、路由、DNS的设置是否有问题
(3)测试网关或路由器的通畅情况。先测网关然后再测路由器,一级一级地测试
(4)测试ping公网ip的通畅情况(平时要记几个外部IP)
(5)测试DNS的通畅情况,可以直接ping网站地址
网 络排错的具体步骤
为了更好的讲述网络排错的过程和思路,假设我们有下面的一个网络环境:
(说明:虽然是假设,但实际上该网络环境是通过GNS3联动虚拟机和真实网络架设起来的,所以是可以真实参考的)
下面,我们就以上面这个网络环境为例子,详细介绍我们的网络排错思路,每一步要怎么做,每一步为什么要这样做以及这样做之后我们可以得到什么信息,都会做一个说明。
3.1 检查物理链路是否有问题
这一步是我个人认为在做网络排错时必须要做的第一步!经常会听朋友说,领导的电脑上不了网,需要过去排错,搞了老半天,还发现不了问题,最后在几经绝望之时,竟然发现网线都没接上电脑。这就真的是悲剧了,浪费了很多时间不说,这样的网络排错思路本来就是有错误的。
因为也许不是每个人都可以去机房查看交换机的接线情况,所以这一步,我们排查的重点范围就应该放在如下面图所示的地方:
在这一步,下面几点是需要注意排查的:
1. 确认电脑本身的网卡有没有问题
2. 确认接的网线有没有问题
3. 本机所连接的交换机(如果可以去机房查看的话)
如果上面这几点排查都没有问题了,那么就是该网络环境中的其他设备问题了。这一范围的排查相对比较简单,因为只涉及到物理链路的连接问题。
对于这种测试,可以考虑使用测线器,但个人的建议是,拿一台配置正确的笔记本来做测试也未尝不可。
3.2 查看本机IP地址、路由、DNS的设置是否有问题
上面第一步,物理链路的排查没有问题了,也就是说,电脑接上网线之后,电脑有反应了,可以识别,但是网络还是不通,来到这一步,就应该先把注意的范围放在电脑的设置上面了。
这一步,我们关注的重点是:
1. IP地址设置
如果采用的是DHCP自动获取的方法,那么这时候只需要看自己本机的设置上有没有开启自动获取IP的设置以及有没有开启相关的服务;
如果用的是静态IP,那么就必须要注意IP地址的填写有没有错(一般网络管理人员给的)、IP地址的子网掩码有没有问题(这很重要,对于静态IP,很多人在这里设置错误,建议是,最好把IP地址、VLSM这方面的知识学一下)。
一般可以用下面的命令查看:
2. 路由设置
对于服务器、PC,一般是指默认网关的设置了;对于路由器本身或三层交换机,那就是静态路由或动态路由的设置问题了。
3. DNS设置
主要是要确保所设置的DNS服务器地址到底有没有提供域名解析服务或者是否出现了故障,至于如何判断,后面会给出方法,这里关注的是,你得设置一个正确的DNS服务器地址或可以自动获取。在windows上面你可以通过下面的命令查看:
3.3 测试网关或路由器的通畅情况。先测网关然后再测路由器,一级一级地测试
在上面的网络环境中,在网络通的情况下,我们在电脑上使用命令tracert -d命令,会得到下面的结果:
通过这个测试结果,我们可以清楚地知道电脑在访问互联网时,数据的走向情况:
根据这个数据走向,我们就可以得到一个重要的思路,就是根据数据走向来检测网络的通畅情况!因此,我们可以分两步:
1. 先测试电脑到网关192.168.2.254的通畅情况
我们可以在自己的电脑上自己ping网关的地址,看是否有响应
一般这样的判断方法是比较快的,但有时候,无论怎样ping都不能,那么则可能有以下的几种情况:
a. 网关设备做了禁止ping的设置
b. 网关接口或网关设备出现故障
对于a,一般很少会在这些设备在做ping的限制操作,实在是没有太大的必要这样做,当然,网络安全等要求十分严格的除外。ping通192.168.2.254网关后,再ping一下172.16.13.1以确认电脑到整个网关设备都没有问题。
对于ping不通的时候,我个人还建议在电脑上执行如下操作:
即查看电脑本身有没有获取到网关的MAC的地址,显然,如果没有网关的MAC地址,那也是不可能ping通网关的,在排除了前面电脑设置的问题后,你可以猜测是网关设备出了问题,这时就可以联系网络工程师对网关设备进行测试了。
2. 测试到其它路由器的通畅情况
前面一步没有问题了,也就是电脑到网关通信正常了,再测试网关到出口路由器的通畅情况:
这里,我们使用tracert -d命令就可以了:
当然,如果发现不通,那么则可能是下面的情况:
a. 网关设备与路由器之间的物理链路问题
b. 网关设备与路由器之间的设置问题,比如路由协议、接口配置之类的
出现上面的情况,那就是网络工程师的问题了,当然,如果你是网络工程师,应该要马上查看一下设备的状态,看是不是设备哪里出现问题了。
上面的步骤完成了,假设你的出口路由器设置是没有问题的,比如NAT与默认路由等的设置,那么我们大致可以知道,内网的一个基本通信是正常的(至少你的电脑和出口路由器的通信没问题),我们就要看看电脑到底能不能访问互联网了。
3.4 测试ping公网ip的通畅情况(平时要记几个外部IP)
来到这一步的时候,就说明前面三步是没有问题的,也就是说,本地局域网络的通信是正常的,这时要做的就是判断本地局域网络与外网(公网)之间的通信有没有问题了:
这里采取的是直接ping公网地址的方法,是为了排除DNS的影响(万一你的DNS设置又有问题),至于要ping什么样的公网地址,个人建议是,可以ping一些没有禁止ping的公共DNS服务器地址,比如114.114.114.114和8.8.8.8的:
这样之后,基本上就可以确定网络是没有问题的了。当然,这里并没有提到出口放置防火墙的情况,实际上,思路是一致的,但是,你需要考虑的是,你的访问数据有没有被防火墙给过滤掉,是数据出去的时候过滤了,还是数据回来的时候过滤了?由于还要涉及到防火墙的设置,这里就不再提及了,只是仍要注意这一点就是了。
3.5 测试DNS的通畅情况,可以直接ping网站地址
如题,可以直接ping网站地址,看有没有回显IP地址,至于通不通是另外一回事,只要可以回显IP地址,那么DNS就没有问题了,不过这里仍然要说一下nslookup这个命令,这是一个非常好用的命令,我平常自己在网络排错时,基本上都会用到:
当然也可以像下面这样使用:
使用nslookup命令,作用有二:
1.帮你测试你设置的DNS服务器有没有问题
2.在不考虑DNS服务器是否智能的前提下,你可以根据回显IP地址速度的快慢来大致判断DNS服务器的优劣情况
所以可以充分利用nslookup命令了。
最后重要说明
其实基本上,一个相对完整的网络排错过程就应该如上面所说的了,不过,是基本上的,因为上面的讲解,都几乎是假定你是没有权限进入机房查看网络设备的情况的。
事实上,你是根本不需要照搬来进行上面的全部步骤的,在实际排错的过程中,可能你用到的只是其中的一小部分而已,毕竟,如果每次都这样下来,没有谁是不会疯掉的,因为一些很简单的问题也要这样折腾,那就是太浪费时间了!但是,上面的方法,只是提出一种网络排错的思路,希望按照这个思路可以判断出网络的问题出现在哪里,至于如何去解决,这中间真的又涉及到太多太多的经验问题。其实整个下来,个人觉得,最重要的仍然不是技术本身,而是在网络排错过程当中的一个思路,思路决定出路,这可以让自己在网络排错的过程中时刻保持清醒的头脑,这一点很重要。
2. 网络故障排查方法有哪些
1. 从客户端电脑着手
当有用户报告出现网络问题时,应该首先从该用户的电脑开始检查,会让整个排错过程变得更容易。
可以让用户尝试访问一些常用的网站,如网易、新浪、网络等,如果用户表示访问正常,再通过镜像盘符访问内网的资源。通过以上客户端的操作,可以帮助我们判断到底是客户端的问题还是服务器的问题。
2. 缩小客户端问题范围
如果用户无法访问网络,可以让其尝试使用相邻的其它电脑。如果另一台电脑网络正常,那么问题肯定就出在客户端电脑上了。
接下来要确认的就是客户端电脑的物理连接部分。让用户通过连接无线网络的方式确定有线网络的硬件和连接部分是否有问题,或者重启系统进入安全模式,排除恶意软件的干扰。
如果客户端电脑看上去没什么问题,再让用户通过笔记本电脑接入网络,查看是否是网线或水晶头问题。如果问题只集中在一台电脑,并且是采用无线网络连接的,那么可以确定无线网卡是开启状态的。
事实上,很多笔记本电脑为了节省电力,都能够单独关闭无线网卡。而用户很可能不小心关闭了无线网卡,这种情况吧也是较为常见的。
3. 排查交换机和路由器
排除了客户端的问题后,我们来排查交换机和路由器。
如果之前的电脑能顺利工作,但是换了一台新电脑,通过相同网线却上不了网,那么排出新客户端配置问题后,问题很可能就出在交换机部分。因此要继续检查交换机、路由器以及调制解调器等设备。对于较小的客户端网络环境或DSL连接方式,这个检查很有必要。而且通过电话进行排错指导时,这一步检查也很方便。
可以通过电话指导用户关闭路由器、交换机和DSL调制解调器的电源,再将他们打开,检查网络是否恢复正常。
如果还不正常,可以让用户重复上面的关闭和启动工作,同时再加上重启客户端电脑(解决DHCP可能存在的问题)。
如果问题还没有排除,那么问题可能就出在为客户端提供网络服务的供应商那边。可以自己联系网络供应商或者让用户联系网络供应商。如果网络供应商反馈网络正常,那么就需要你对客户端一侧做更进一步的检查了。
4. 检查服务器
如果是整个公司的电脑都无法使用局域网(当然也包括广域网),那么怀疑的重点应该是服务器。
首先要做的是登录服务器,打开浏览器,尝试访问常用门户网站,如果无法访问,就需要进一步对服务器进行检查。
可以让用户禁用后再启用网络,一般需要做两次,一次是针对内网接口,另一次则是针对外网接口。在网络接口重新启用后,再尝试访问互联网,并通过客户端电脑尝试访问网站。如果还不成功,就需要进一步研究了。
5. 重启服务器
首先确定用户公司已经没有员工在使用服务器上的资源了,甚至可以让该公司所有客户端电脑暂时关闭。
这一步完成后,你可以提醒用户,服务器重启完毕需要15到30分钟,在服务器最终启动完毕后,可以让出现故障的终端启动,检查之前的故障是否已经排除。如果故障还没排除,你就应该起身前往故障现场了。
3. 计算机网络故障判断与排查分析
计算机网络故障判断与排查分析
要想搞好网络的运转管理和故障诊断工作,就必须提高故障诊断水平,认真学习有关网络技术理论,清楚网络的结构设计,熟悉常用的诊断工具,准确的描述故障现象。以下是我分享的计算机网络故障判断与排查分析论文,欢迎阅读借鉴。
摘要: 计算机网络故障诊断是从事计算机网络管理的一项重要技术工作,解决网络故障,可以发挥网络的最大作用。本文主要介绍了计算机网络故障判断步骤以及几种故障排除策略。
关键词: 计算机;故障;网络;排除策略
一、前言
随着计算机网络的发展,网络之间的连接越来越复杂,计算机网络发生故障是不可避开的。网络故障诊断的目的就是为了确定网络故障的部位,使网络恢复正常运转。
二、计算机网络故障判断步骤
(1)首先要检查网卡是否正常。每块网卡都带有LED指示灯,位置一般在主机箱的背面,绿灯表示连接正常,有的绿灯和红灯都要亮,红灯表示连接故障,不亮表示无连接或线路不通。根据数据流量的大小,指示灯会时快时慢的闪烁。正常情况下,在不传送数据时,网卡的指示灯闪烁较慢,传送数据时,闪烁较快。
(2)连接计算机与其他网络设备的跳线、网线是否畅通。网络连线的故障通常包括网络线内部断裂、双绞线、RJ-45水晶头接触不良,可用测线器检测。还要检查两边的RJ-45头是否插好,以及信息插座是否有故障。
三、计算机网络连通性故障排除策略
(1)确认连通性故障
当出现一种网络应用故障时,如无法接入Internet,首先尝试使用其他网络应用,如查找网络中的其他电脑,或使用局域网中的Web浏览等。如果其他网络应用可正常使用,如无法接入Internet,却能够在“网上邻居”中找到其他电脑,或可ping到其他电脑,即可排除连通性故障理由。如果其他网络应用均无法实现,继续下面操作。
(2)看LED灯判断网卡的故障
首先查看网卡的指示灯是否正常。正常情况下,在不传送数据时,网卡的指示灯闪烁较慢,传送数据时,闪烁较快。无论是不亮,还是长亮不灭,都表明有故障存在。如果网卡的指示灯不正常,需关掉电脑更换网卡。对于Hub的指示灯,凡是插有网线的'端口,指示灯都亮。由于是Hub,所以,指示灯的作用只能指示该端口是否连接有终端设备,不能显示通信状态。
(3)判断是否是Hub和双绞线的理由
如果确定网卡和协议都正确的情况下,还是网络不通,可初步断定是Hub和双绞线的理由。为了进一步进行确认,可再换一台电脑用同样的策略进行判断。如果其他电脑与本机连接正常,则故障一定是先前的那台电脑和Hub的接口上。
如果确定Hub有故障,应首先检查Hub的指示灯是否正常,如果先前那台电脑与Hub连接的接口灯不亮说明该Hub的接口有故障(Hub的指示灯表明插有网线的端口,指示灯亮,指示灯不能显示通信状态)。
通过上面的故障压缩,我们就可以判断故障出在网卡、双绞线或Hub上。
四、计算机协议故障排除策略
(1)协议故障的表现
协议故障通常表现为以下几种情况:
①电脑无法登录到服务器。
②电脑在“网上邻居”中既看不到自己,也无法在网络中访问其他电脑。
③电脑在“网上邻居”中能看到自己和其他成员,但无法访问其他电脑。
④电脑无法通过局域网接入Internet。
(2)故障理由分析
协议故障理由通常有以下二种情况:
①协议未安装:实现局域网通信,需安装NetBEUI协议。
②协议配置不正确:TCP/IP协议涉及到的基本参数有四个,包括IP地址、子网掩码、DNS、网关,任何一个设置错误,都会导致故障发生。
(3)排除步骤
当电脑出现以上协议故障现象时,应当按照以下步骤进行故障的定位:
①检查电脑是否安装TCP/IP和NetBEUI协议,如果没有,倡议安装这两个协议,并把TCP/IP参数配置好,然后重新启动电脑。
②使用ping命令,测试与其他电脑的连接情况。
③在“制约面板”的“网络”属性中,单击“文件及打印共享”按钮,在弹出的“文件及打印共享”对话框中检查一下,看看是否选中了“允许其他用户访问我的文件”和“允许其他电脑使用我的打印机”复选框,或者其中的一个。如果没有,全部选中或选中一个。否则将无法使用共享文件夹。
④系统重新启动后,双击“网上邻居”,将显示网络中的其他电脑和共享资源。
五、计算机配置故障排除策略
(1)配置故障表现及分析
配置故障更多的时候是表现在不能实现网络所提供的各种服务上,如不能访问某一台电脑等。因此,在修改配置前,必须做好原有配置的记录,并最好进行备份。配置故障通常表现为以下几种:①电脑只能与某些电脑而不是全部电脑进行通信;②电脑无法访问任何其他设备。
(2)配置故障排错步骤
首先检查发生故障电脑的相关配置。如果发现错误,修改后,再测试相应的网络服务能否实现。如果没有发现错误,或相应的网络服务不能实现,我们就需要测试系统内的其他电脑是否有类似的故障,如果有同样的故障,说明理由出在网络设备上,如Hub。反之,检查被访问电脑对该访问电脑所提供的服务作认真的检查。
六、结束语
要想搞好网络的运转管理和故障诊断工作,就必须提高故障诊断水平,认真学习有关网络技术理论,清楚网络的结构设计,熟悉常用的诊断工具,准确的描述故障现象。
参考文献
[1]肖文军.浅析计算机网络故障分析及维护[J].电脑知识与技术,2009(18).
[2]蓝峰.浅谈计算机网络常见故障处理及维护策略[J].硅谷,2009(03).
;