浅谈局域网故障排除(一)
大多数网络故障缘于硬件:比如电缆、中继器、hub、switch和网卡等。一般来说,可以用二分法隔离、划分故障在一个小的功能段上,排除最大的简单段,然后再从一个方便的、靠近问题的点入手确定、排除故障。首先,我们要查找故障的位置。
在查找过程中,一定要沿网段多做几次测试。如果故障现象随测试点的不同还保持一样的话,就可以依照测试结果去排除故障。如果故障现象在一些或所有的测试点都不相同的话,就要把查找故障的方向定在物理故障。例如坏电缆、噪声、接地循环等。要提高测试质量,在测试的同时要把测试仪器设置成至少可同时发送较低的流量。由于增加了网络流量,微小的和间歇性的故障会被暴露出来。
在测试网络前要排除单机故障的可能:
重新冷启动pc机(热启动不能复位全部的适配卡),确认pc机没有本身的硬件故障,确认所有的网络电缆都连接正确,确认所有的网卡驱动软件都正常地装入,没有错误,确认服务器或服务没有改变,比如重新配置增加硬件或软件。
我们经常会遇到下面的网络故障现象。
不能访问服务器或某项服务
要先测试一下这一故障是只影响该工作站,还是影响其它站点,可以通过其它工作站登录服务器或服务来证明这一点。这些工作站要在同一网段或hub上。如果故障在同一网段或hub上的其它的站点也存在,就试着从其它的hub或网段上的站点进行测试。
本地故障
在进行硬件故障查找以前,要确认其它用户也不能登录从这台机器上,这就排除了用户帐号的错误。对一个单一的站点来说,典型的故障多发生在坏电缆、坏网卡、驱动软件或是工作站设置的不正确等问题上。
全局问题
通常来说,在同轴电缆构架的网中查找故障要用“二分法”来解决。间歇性的故障是比较难以隔离的。
关于电缆
检查电缆连接性。常用方法就是检查hub、收发器以及近期出产的网卡上的状态灯。如果是10base5的电缆,要仔细检查所有的aui电缆是否牢固地连接,划锁要同时锁牢,很多问题只要简单地把未接牢的部分重新紧一下就解决了。
电缆和连接部件受损
在检查问题时,要注意受损的电缆和连接部件:不正确的电缆类型、未打好的rj45头、未按牢的bnc头等。对怀疑有问题的电缆可以用一般的电缆测试仪或替代法进行测试。
连接接口的正确性
连接接口的不正确,即电缆的接线错误可以引起故障。
碰撞问题
如果平均碰撞率大于10%或是观察到非常高的碰撞,就需要进一步的测试了。如果可能,试着通过减少网段规模(将网络分成小段)并随时监测碰撞的变化以隔离出发生问题的区域。为了跟踪碰撞情况,就必须知道网络的流量。可以使用背景流量发生器来加入适量的流量(100帧/秒、100字节长的流量),并同时观察网络的统计显示。某些和介质有关的故障是与流量的大小成正比的。可以用控制键改变流量同时观察碰撞与错误的改变。在同一网段相距几尺远的不同观察点所看到的情况就不同,要多找几个点来测试并留意所发生的变化。
如果碰撞与流量成正比,或碰撞几乎是100%,或几乎没有正常的流量,则可能是布线系统出了问题。对于utp的布线,可以在hub上断开电缆然后进行电缆测试。对于同轴缆就要进行阻抗测量,可以使用数字表或其他仪表的直流通断功能进行测试。
利用率过高
如果利用率过高(平均值大于40%,瞬时峰值高于60%),那么网段负荷就过重了。应当考虑安装网桥或路由器以减少在网段中的流量或把网段分成若干小的网段。
客户服务器的连接
连通性
使用专业仪表,你可以运行server list或novell ping测试功能,用来验证从测试点是否可以访问服务器或服务功能。如果服务器没有回应,重新冷启动服务器并注意观察所有所需的驱动软件是否正确加载,有无错误提示。另外,也可对服务器进行几次ping测试,要确认请求信号与返回的响应信号数目相等,结果不一致则表明有时好时坏的网卡或hub的故障导致帧的丢失。临界状态的和已坏的桥或路由器也可以用此方法很快地定位。
服务器或服务的可达性
如果使用协议分析仪,就要捕获3至4分钟的数据包来分析。看一下是否有从服务器发出延时请求,并找出是哪个服务器,如果有延时请求,则表明服务器不能完全处理所加载的任务,每一个延时请求作废一个任务请求。
上一篇: iOS 倒计时的一种实现
下一篇: MariaDB删除重复记录