硬盘故障的分析与排除方法总结

时间:2020-07-05 14:12:04 硬件维护 我要投稿

关于硬盘故障的分析与排除方法总结

  硬盘故障分析与排除

关于硬盘故障的分析与排除方法总结

  在实际工作中,硬盘并不是经常出现问题的配件,正常使用中的硬盘一般能够保持五年的工作时间。而大部分的硬盘故障都是由于出现坏道所引起的,解决的方法是利用特殊的软件查找出硬盘的坏道并将期隐藏屏蔽。很多情况下检查出的机器硬盘故障,往往是由于设置不正确或其它的因素所造成的,这里笔者为大家介绍两例比较常见的硬盘故障及排除方法。

  一、都是数据线惹的祸接触不良导致无法识别硬盘故障排除实例

  故障现象:学校网络教室的一台学生用机,近期经常出现不能开机或开机后提示找不到硬盘的情况,通过仔细检查,在开机后能够听到硬盘盘片的转动声音,系统检测启动设备时提示无法找到硬盘。机器的型号是:英特尔810主板,英特尔赛扬1.1GHz处理器,256MDDR266内存,硬盘为希捷酷鱼7200.740GB。

  重新启动机器时或者进入CMOS重新设置一下就一切正常,但在使用过程中还是经常会重新启动,重新启动后则又无法找到硬盘。刚开始故障并不算严重,还能够将就使用,但随着使用次数的增多,故障越来越频繁,于是决定彻底解决。

  故障分析与解决:按照正常的检修顺序,先对硬盘进行彻底杀毒,用最新版的江民和瑞星查杀后却一无所获,基本上排除了病毒破坏引导区和分区表的可能。于是又开始怀疑是CMOS电池老化导致硬盘有时无法识别,更换了一个新电池以后故障还是依旧。根据故障现象来看,如果软件没有问题,那么看到故障出自硬盘本身,是不是硬盘的质量出了问题,由于是在机房里,每一台机器的配置基本上都是相同的,这就给替换法带来了方便,把硬盘和另一台电脑互换以后,结果两台电脑竟然都没有出现问题!这就奇怪了,难道硬盘和主板之间还有兼容性的问题不成?绝对不可能呀,这两台机器的主板可都是一个型号的,均为英特尔的原装810芯片组的主板呀。

  排除了硬盘自身的故障以后,因为网络教室里每一台计算机都有自己的名字,而且IP地址也不同,为了便于管理,把硬盘又换了回来,结果故障又来找了。

  百思不得其解,怎么又出现故障了呢?想来想去,除了互换硬盘的时候插拔了数据线,其它地方都没有动,难道是数据线存在接触不良的现象?于是赶紧把一根新的80芯数据线换上,结果一切正常。经过一个星期的测试,证实故障彻底排除。

  故障总结:这起故障的主要原因是80芯数据线在多次的插拔以后,由于线径较细,存在接触不良的现象,而在检修的时候两台电脑互换硬盘,把接触不良的地方接上了,等到再换回来的时候又断开了,导致了故障的重演。

  为此提醒各位读者,如果你使用是仍然是IDE的硬盘,那么你在拔数据线的时候动作一定要轻,要小心,不能很随意的一下子就把数据线拔下来,遇到硬盘的IDE口和数据线插头很紧的情况,很容易造成数据线的插头和芯线之间的接触不良现象。

  二、硬盘散热不良引起电脑反复重启或蓝屏故障排除

  故障现象:朋友反应,他的一台购买了两年多的HP笔记本,最近总是莫名其妙的反复重启或蓝屏死机现象。故障的具体表现是:开启电脑后,大约正常使用三、四个小时后,电脑便会莫名其妙的重新启动,启动后再次连续使用一个小时的时间,电脑便会再次自动重启。重启现象还算不错,有时在使用中直接出现蓝屏死机的现象,让朋友感到非常的恼火,由于过了免费的维修期,于是找笔者帮助解决。

  故障分析与排除:朋友的'这台笔记本保养的不错,虽然有两个年头,但看起来还相当的好。朋友介绍:本本使用相当仔细,故障出现是在两周前,根据朋友介绍的故障,基本判断是由于散热不良所引起的。打开朋友的电脑,让其工作一个小时后(运行简单的应用软件),用手触摸机身表面,当手接触到安放硬盘的部位时,发现此处特别的热。笔记本硬盘安装的部位应该比其它的部位要明显的热,但像朋友这样热的还是头次见到,何况这才工作了一个小时。

  于是将笔记本打开,仔细观察用于硬盘的散热风扇,发现这个风扇居然没有转动。如此之高的温度风扇都没有反映,难怪经常重启和死机呢。找到问题的根源后,去市场中购买了一个新的同型号的散热器换上,打开笔记本检测七八个小时,均没有出现问题,至此故障解决。

  故障总结:大家都知道,笔记本对散热的要求相当的高,特别是硬盘,发热量明显比其它的部件要大,由于体积受限,因此在散热方面做得一般都不太好。朋友以前用机器时从没有连续用过四个小时,而那时也在冬天,最近由于比较忙才经常使用电脑,却无意中发现了此故障,相信这也不是偶然吧。因此提醒各位朋友,如果遇到经常重启和蓝屏死机的现象,不妨从散热处多思考一下。

  真内存故障造成的假硬盘故障

  一客户的电脑出了问题,原用Win98操作系统,内存是KingMaxSDRAM128MBPC150,硬盘是金钻七代40GB。

  故障现象:在一次非法关机后重新开机就无法进入Win98系统,每次开机磁盘自检运行到D盘的80%左右就停止了。

  故障处理:笔者根据上面的现象进行了如下操作:进入Dos运行SCANDISK扫描磁盘,提示D盘有坏道,接着顺利地格式化了D盘,满以为坏道已修复,重启,可是问题依旧。又反复高级格式化几次,甚至重新分区,但检测依旧提示D盘有坏道。当然重装系统也是不行的。

  由于该硬盘还在保修期内,笔者便把它发回代理商那里返修。

  过了一个星期那个硬盘返回来了。光盘启动直接进入DOS,对其分区、高级格式化准备装系统。但是检测到D盘时又被卡住了,根本无法装Windows系统。没有办法,只好找硬盘代理商把一块新硬盘发过来。来回折腾了足足有两个星期,满以为这下可以给客户一个满意的交待了。可是结果令人吃惊,还是提示有坏道?而且在D盘同一位置。可以肯定这是一个全新的硬盘,怎么会出现同样的问题呢。

  重新开机,硬盘自检到D盘的84%就停止了。仔细看提示,发现前三行就有内存检测错误的相关提示。问题可能就出在内存上。换了条内存一试果然一切正常。将该内存插到正常的机上又出现同样问题。

  经验总结:这是一例表面是硬盘错误实际上却是内存错误的问题。根据笔者的经验,这样的故障在实际工作中也并不少见,所以笔者建议大家在碰到硬件故障的时候要多注意系统提示,问题可能就会很快明朗。笔者想,如果早使用替换法来检测,就可以很快判定不是硬盘的问题,不必花费大量的时间进行格式化和重装系统了,也不会发生硬盘历时两个星期的返修和退换事情了。

  硬盘诊断要领

  1.检查电源部是否供电

  1)与硬盘相连的电源接头(Connector)的中间的2插头是接地(ground)头,两边的接头各位+5VDC和+12VDC。

  2)可通过spindleMotor是否转动来判断电源供应与否,如果转动就说明电源供电正常。

  2.连线(Cable)是否连接正确

  1)RibornCable有颜色的部分一般时1所在的部分,第20pin是key.,因此没有pin。

  2)有电源的一边一般为1所在的一边。

  3)经常移动的硬盘或使用时间较长的计算机而言,更换连线(cable)来测试也是较好的方法,因为虽然连接部和外观上没有异常,但也可能因为接触阻力,noixe,连接不良(poorconnection)等问题而不能正常工作的情况也时有发生。

  3.检查设置(setting)

  1)检查是否根据使用数量和使用目的而正确设定DiskSelectJumper(Master/Slave)。

  4.检查安装(setup)是否正确

  -有自动检测(AutoDetection)功能的,打开电源后用自动检测(AutoDetection)来识别硬盘。

  1)如自动检测(AutoDetection)和硬盘初始化一切正常,可以认为除坏扇区等表面损伤外硬盘硬件基本正常。

  2)找不到硬盘(自动检测(AutoDetection)不到)时,按照5以下步骤找到后,按照各自的要领分区(partition),格式化(format),SurfaceAnalysis,NDD依次检查硬盘状况。

  5.检查spidlemotor是否转动

  1)检查spindlemotor是否转动时,供应电源并用手轻触磁盘得上盖(topcover),可感觉到转动震动。大部分硬盘驱动器发出转动声音。

  2)SpindleMotor不转动的原因有

  -没有供应电源

  -Board有损

  -spindleMotor自身有损

  -Stictiontiction

  _"的提示我哭!!于是我用启动盘(软盘)启动机器,到是能引导,出现A:>输入C:后再输入dir命令,又出现了"Notready

  readingdrivec"abort,retry,fail?_"提示,不能进系统。我再哭!!而且其他分区不见了。

  处理:用“三茗硬盘医生”中的修复硬盘功能修复硬盘,点一下回车问题解决了。

  教你判断硬盘是哪里出现了问题

  ①首先检查CMOSSETUP是否丢失了硬盘配置信息。测量主板上COMSRAM电路是否为电池有故障,或元器件(如二极管、三极管、电阻、电容等)损坏能原因而CMOS中的硬盘配置参数出错。

  ②通过加电自测,若屏幕显示错误信息“1701”或“HardDiskError”,说明硬盘确实有故障。但也可能是硬盘适配卡未插好、或者硬盘与硬盘适配器的插接处未插好、或者硬盘适配器有故障等。

  ③关机,拆开机盖,测+5V、+12V电源是否正常,电源盒风机是否转动。以此来判断是否外电路缺电。

  ④检查信号电缆线,插头与硬盘适配卡是否插好,有无插反或接触不良。可尝试交换一些电缆插头试一下。

  ⑤采用“替代法”来确定故障部件。找一块好硬盘适配卡(或多功能卡)与该硬盘适配卡比较,判断是硬盘适配卡还是硬盘驱动器本身有问题。

  ⑥观察步进电机端止档销是否卡死,如卡死,用手拨回起始位置。

  以上几个步骤,用户需要仔细检查、测试、分析,找出坏的元器件进行修理,或者更换硬盘适配卡。

  经以上的处理后,只要不是硬盘盘体本身损坏,仅仅是一般性的接插件的接触不良或外电路故障则多数能够迅速排除。

  测电阻法

  该测量方法一般是用万用表的电阻档测量部件或元件的内阻,根据其阻值的大小或通断情况,分析电路中的故障原因。一般元器件或部件的输入引脚和输出引脚对地或对电源都有一定的内阻,用普通万用表测量,有很多情况都会出现正抽电阻小,反向电阻大的情况。一般正向阻值在几十欧姆至100欧姆左右,而反向电阻多在数百欧姆以上。但正向电阻决不会等于0或接近0,反向电阻也不会无穷大,否则就应怀疑管脚是否有短路或开路的情况。当断定硬盘子系统的故障是在某一板卡或几块芯片时,则可用电阻法进行查找。关机停电,然后测量器件或板卡的通断、开路短路、阻值大小等,以此来判断故障点。若测量硬盘的步进电机绕组的直流电阻为24欧,则符合标称值为正常;10欧左右为局部短路;0欧或几欧为绕组短路烧毁。

  硬盘驱动器的扁平电缆信号线常用通断法进行测量。硬盘的电源线既可拔下单测也可在线并测其对地阻;如果无穷大,则为断路;如果阻值小于10欧,则应怀疑局部。

  测电压法

  该测量方法是在加是怕情况下,用万用表测量部件或元件的各管脚之间对地的电压大小,并将其与逻辑图或其它参考点的政党电压值进行比较。若电压值与正常参考值之间相差较大,则青蛙该部件或元件有故障;若电压正常,说明该部分完好,可转入对其它部件或元件的测试。

  一般硬盘电源与软盘插线一样,四个线头分别为+12V、+5V、-5V和地线。硬盘步进电机额定电压为+12V。硬盘启动时电流大,当电源稳压不良时(电压从12V下降到10.5V),会造成转速不稳或启动困难。

  Ⅰ/O通道系统板扩展槽上的电源电压为+12V、-12V、+5V和-5V。板上信号电压的高电平应大于2.5V,低电平应小于0.5V。硬盘驱动器插头、插座按照引脚的排列都有一份电压表,高电平在2.5-3.0V之间。若高电平输出小于3V,低电平输出大于0.6V即为故障电平。逻辑是怦的测量可用试波器测量或者用逻辑笔估算。

  测电流法

  如果有局部短路现象,则短路元件会升温发热并可能引起保险丝熔断。将万用表串入故障线路,核对电流是否超过正常值。硬盘驱动器适配卡上的芯片短路会导致系统析负载电流加大,驱动电机短路或驱动器短路会导致主机电源故障。硬盘电源+12V的工作电流应为1.1A左右。当硬盘驱动器负载电流加大时,会使硬盘启动时好时坏。电机短路或负载过流轻则保险熔断,重则导致电源块、开关调整管损坏。在加大电流回路中可串入流假负载进行测量。如有保险的线路,则可断开保险管一头将表串入进行测量。在印刷板上的某芯片的电源线,可用刻刀或钢锯条割断铜泊引线串入万用表测量。电机插头、电源插头可从卡口里将电源线起出来串入表测量。

  硬盘故障提示信息的含义

  (1)Dateerror(数据错误)

  从软盘或硬盘上读取的数据存在不可修复错误,磁盘上有坏扇区和坏的文件分配表。

  (2)Harddiskconfigurationerror(硬盘配置错误)

  硬盘配置不正确,跳线不对,硬盘参数设置不正确等。

  (3)Harddiskcontrollerfailure(硬盘控制器失效)

  控制器卡(多功能卡)松动,连线不对,硬盘参数设置不正确等。

  (4)Harddiskfailure(硬盘失效故障)

  控制器卡(多功能卡)故障,硬盘配置不正确,跳线不对,硬盘物理故障。

  (5)Harddiskdrivereadfailure(硬盘驱动器读取失效)

  控制器卡(多功能卡)松动,硬盘配置不正确,硬盘参数设置不正确,硬盘记录数据破坏等。

  (6)Nobootdeviceavailable(无引导设备)

  系统找不到作为引导设备的软盘或者硬盘。

  (7)Nobootsectoronharddiskdrive(硬盘上无引导扇区)

  硬盘上引导扇区丢失,感染有病毒或者配置参数不正确。

  (8)Nonsystemdiskordiskerror(非系统盘或者磁盘错误)

  作为引导盘的磁盘不是系统盘,不含有系统引导和核心文件,或者磁盘片本身故障。

  (9)Sectornotfound(扇区未找到)

  系统盘在软盘和硬盘上不能定位给定扇区。

  (10)Seekerror(搜索错误)

  系统在软盘和硬盘上不能定位给定扇区、磁道或磁头。

  (11)ResetFailed(硬盘复位失败)

  硬盘或硬盘接口的电路故障。

  (12)FatalErrorBadHardDisk(硬盘致命错误)

  硬盘或硬盘接口故障。

  (13)NoHardDiskInstalled(没有安装硬盘)

  没有安装硬盘,但是CMOS参数中设置了硬盘。

  硬盘驱动器号没有接好,硬盘卡(多功能卡)没有接插好。

  硬盘驱动器或硬盘卡故障。

  硬盘故障的代码见表

  代码代码含义

  1700硬盘系统通过(正常)

  1701不可识别的硬盘系统

  1702硬盘操作超时

  1703硬盘驱动器选择失败

  1704硬盘控制器失败

  1705要找的记录未找到

  1706写操作失败

  1707道信号错

  1708磁头选择信号有错

  1709ECC检验错

  1710读数据时扇区缓冲器溢出

  1711坏的地址标志

  1712不可识别的错误

  1713数据比较错

  1780硬盘驱动器C故障

  1781D盘故障

  1782硬盘控制器错

  1790C盘测试错

  1791D盘测试错

  硬盘故障怎么检查呢

  在电脑各种硬件设备所发生的故障中,硬盘故障所占的比例还是比较高的。由于硬盘在电脑配件中占有极其特殊的地位,当它出现故障时轻则主机不能启动,重则还可能会使重要的数据资料丢失。硬盘故障的具体表现是多种多样的,在本文里则主要讲解两个方面的故障,上篇为大家介绍硬盘不能启动的故障的解决。下篇则为大家介绍逻辑和物理坏道的处理。

  启动故障

  在电脑的使用过程中,我们都有可能会遇到电脑无法启动的问题。引起系统启动故障的原因有很多种,其中很多都与硬盘有关。一般情况下,当硬盘出现故障的时候,BIOS会给出一些英文提示信息。由于不同厂家主板或不同版本的BIOS,其给出的提示信息可能会存在一些差异,但基本上都是大同小异的。下面我们就以使用较为常见的AwardBIOS为例,探讨一下如何利用其给出的提示信息,判断并处理硬盘不能启动故障的方法。

  1.Harddiskcontrollerfailure(硬盘控制器失效)。这是最为常见的错误提示之一,当出现这种情况的时候,应仔细检查数据线的连接插头是否存在着松动、连线是否正确或者是硬盘参数设置是否正确。

  2.Dateerror(数据错误)。发生这种情况时,系统从硬盘上读取的数据存在有不可修复性错误或者磁盘上存在有坏扇区。此时可以尝试启动磁盘扫描程序,扫描并纠正扇区的逻辑性错误,假如坏扇区出现的是物理坏道,则需要使用专门的工具尝试修复。

  3.Nobootsectoronharddiskdrive(硬盘上无引导扇区)。这种情况可能是硬盘上的引导扇区被破坏,一般是因为硬盘系统引导区已感染了病毒。遇到这种情况必须先用最新版本的杀毒软件彻底查杀系统中存在的病毒,然后,用诸如KV3000等带有引导扇区恢复功能的软件,尝试恢复引导记录。如果使用WinXP系统,可启动“故障恢复控制台”并调用FIXMBR命令来恢复主引导扇区。

  4.ResetFailed(硬盘复位失败)、FatalErrorBadHardDisk(硬盘致命性错误)、DDNotDetected(没有检测到硬盘)和HDDControlError(硬盘控制错误)。当出现以上任意一个提示时,一般都是硬盘控制电路板、主板上硬盘接口电路或者是盘体内部的机械部位出现了故障,对于这种情况只能请专业人员检修相应的控制电路或直接更换硬盘。

  坏道故障

  通过上面的学习,阿King对硬盘不能启动故障的解决有所了解了,接下来阿King想知道的当然是如何对付自己那已经有坏道的硬盘了。

  老师这期就为阿King介绍一下逻辑坏道和物理坏道的故障和相应的维修。但在开讲之前,老师就提醒阿King,做这项工作一定要慎重仔细。

  逻辑坏道

  出现逻辑坏道是在电脑的日常使用中容易出现的一种硬盘故障,逻辑坏道实际上就是磁盘磁道上面的校验信息(ECC)与磁道的数据和伺服信息不匹配。出现这种故障的主要原因通常都是因为一些程序的错误操作,或者是该处扇区的磁性介质开始出现不稳定现象的先兆。逻辑坏道在一般电脑使用中的表现,就是文件存取时出错或做硬盘克隆时,当到达出错部位后,因弹出出错信息窗口而不能继续下去。

  消除这种逻辑坏道的方法比较简单,很多专用软件如:DM、NORTON的DISKDOCTOR等都能做到,但最常用的还是Windows自带的“磁盘扫描”功能。对于FATl6或FAT32分区来说,可以在DOS实模式下用Scandisk扫描磁盘,此时系统可将逻辑出错的扇区标注出来,以后在进行存取操作时就会避开这些扇区。由于这些软件的使用方法较为简单且也多有介绍,在这里也就不过多地讲解了。

  但是,假如采用的是NTFS分区且安装WindowsXP系统,由于它没有Scandisk这个工具,故只能使用Chkdsk这个工具了。Chkdsk工具会基于所用的文件系统,创建和显示磁盘的状态报告。另外Chkdsk还能够列出并纠正磁盘上的错误。不过如果不带任何参数的话,chkdsk将只显示当前驱动器中磁盘的状态,而不会修正任何的错误,要修正错误则必须包括/f参数。

  物理坏道

  硬盘物理坏道是比较常见的硬盘故障。实际上它是因为震荡、划伤等“硬”原因,导致—些扇区的磁介质失去了磁记忆能力而造成的。

  通常情况下,这样的损坏修复起来都比较麻烦。因为,在硬盘内部的磁道列表中,这个扇区是被标记为正常的,而坏道也是物理性存在的。

  所以,它无法通过扫描、格式化、低格或者激活扇区的方法来加以消除,必须将这个扇区加入到设置在硬盘内部的系统保留区,告诉磁盘这些磁道已经不能使用了,才能在硬盘控制系统的可见范围内消除这个坏道。当然,这样做需要使用一些专用软件,对普通用户来讲维修有些困难。

  不过有些硬盘厂商会提供原厂的工具软件,如IBM/日立的DFT和西部数据的DataLifeGuardDiagnostics。这些原厂的工具软件不但扫描速度快,而且辨别准确率也很高,能够对付较为普遍的硬盘物理坏道故障。因此对硬盘内部进行操作还是原厂的软件较为可靠,除非原厂工具不能解决问题,否则不推荐使用第三方的工具软件。

  相对于上面这种比较高级的隐藏方式,对于那些要求不高的用户来说,则可以通过“坏盘分区器”FBDISK和

  DiskGenius这一对软件的组合,完成将坏道所在位置做成分区隐藏起来的任务。其具体的操作简要介绍如下:

  首先,将下载来的软件复制到一台正常使用的电脑的C盘根目录下,再把出现物理坏道的硬盘作为第2硬盘挂接在该电脑上。接着启动到DOS的实模式下,并运行DiskGenius的可执行程序Diskgen,然后按“Ctrl+Alt”组合键,选择“硬盘”菜单下的“第2硬盘”。这时就可以看到第2硬盘的具体分区情况了。假如要重新规划这块硬盘,就可以把所有分区都删除掉,随后存盘退出。

  接着运行FBDisk,选择要检测的硬盘后按“Y”开始扫描。如果硬盘存在坏道,则FBDisk会自动显示出它在哪个扇区和磁道。扫描完成后它可以把所有的坏道都罗列出来,并询问是否要写入硬盘。如果按“Y”将会自动将坏道隐藏起来,最后按Esc键退出。

  随后再次运行Diskgen,这时就可以看出经过FBDisk处理后的磁盘情况,此时坏道处会呈现—种灰白色。通过Diskgen再稍微将隐藏物理坏道的分区扩大一些。最后,将这些坏道全部隐藏在一个分区里,修复工作即告结束。

  两款软件配合使用是因为,经过FBDisk处理后的硬盘可能会有很多分区,而受软件自身最多4个主分区的限制,会导致硬盘利用率不高的后果。而通过Diskgen的配合,就可以很好地解决这个问题。