欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

宏基笔记本主板基本维修思路

程序员文章站 2024-02-10 08:23:42
宏基笔记本主板基本维修思路在拿到不良MB之时,请不要急于上电!应当先用眼睛仔细观察板面,有可能的话,用一块OK的MB比对着,看板面上的焊接情况以及零件的摆放状况(尤其是多件、错件、漏件和反件),因为很多... 10-05-27...
在拿到不良mb之时,请不要急于上电!应当先用眼睛仔细观察板面,有可能的话,用一块ok的mb比对着,看板面上的焊接情况以及零件的摆放状况(尤其是多件、错件、漏件和反件),因为很多bug的产生都可以归功于这些问题!有些仅仅是零件反件,由于debug人员急于求成,把ng mb拿来就上电,导致了元器件损坏,从而要花好几倍的时间精力来debug……如果养成了eyes checking这种习惯,则可以大大提高debug的效率。
关于“不显示和显示ng”:
当试产mb在f/t被判为不显示时,往往仅是lcd panel没有图像出现,并非mb的显示功能ng,例如cpu、ram没插好也会导致此现象,所以:
不显示定义为当debug card跑过60h时,显示器始终没有画面出现;或者是由于某种原因使post无法跑到60h。
显示ng指的是显示器上有画面出现,只是画面不清晰或者花屏;另外一个就是lcd、crt、s-video无法切换或者error id等。
display problem debugging
一、看power是否ok;
用万用表量每一个power net的对地阻抗,用良板作比对,则可以知道短路与否。有一个判断power有没短路的最快捷的方法是使用power supply,看其显示的电流值:
如果电流值偏大,则表示power有短路,应立即移除adp;用万用表量每一个power net,看是哪个net短路了;确定短路net后,找到相关电路,将bead一组组断开,直至找到短路的地方,然后将损坏的元器件更换。
如果电流值偏小,则表示有些power没起来,依旧用万用表把它找出来。
有关power方面的debugging会在今后完成。
二、post无法跑完造成的不显示;
(一)debug card的led不亮;
在power ok的情况下,debug card的led就会亮起来。如果不亮,可能是mini pci插槽或debug card本身的问题;还有可能是用了不兼容的cpu或ram等,那样会导致led不亮或者显示一些很古怪的符号。。。
(二)debug card显示ff(00);
debug card 显示ff(00)表示cpu连第一道指令都没有去执行。
思路cpurst# <—> pltrst# <—>pcirst#

第一步:(请参考流程图及其解释)

去量cpu复位信号cpurst#:如果ok,则跳到第二步,应该可以用万用表量到cpurst#的电压值有1.05v(napa大概是1.5v);如果 cpurst#量不到,则先在非bga封装的pci device controller pin脚上量pcirst#:如果没有量到,则说明pci总线上有问题,先去看南桥的晶振、clock信号、是否植过球(见下面的注释)以及怀疑其焊接问 题,假如都ok,就要去一一断开每个pci device与pcirst#的连接,确定是哪个device影响了pcirst#;如果pcirst#有量到,则去看北桥复位信号pltrst#有没从 南桥发出:如没有发出,则依旧要看南桥本身的问题;如pltrst#有发出,则看北桥有没收到。可以去量传送pltrst#线路上连接北桥和南桥的电阻。 如果北桥收到pltrst#却没有发cpurst#,则需要去看北桥的晶振、clock信号、是否植过球以及怀疑其焊接问题,排除这些问题之后,就跳到第 二步。
注释:有时板子上bga chip点了彩色的点,灰色的点表示chip曾经被更换过,绿色或者红色的点则表示该chip是工厂回收再利用的(经过重植球),极有可能本身就是坏的。点的颜色所代表的意思并非统一的,要看工厂怎么定。
第二步:
cpu本体ok,而且收到了cpurst#,debug card还是ff(00),则有可能是cpu或北桥的外围电路有问题,例如ref、test、comp、cfg等。

cpu gtlref and test

cpu comp[0,3]

north-bridge h_vref

north-bridge strap pin

north-bridge h_xscomp/h_yswing
另外一种可能是cpu和北桥之间的data、address信号沟通有问题,造成此问题的原因是cpu socket、北桥或者pcb trace的问题。(请参考流程图及其解释)

我们必须对ha#[3..31]和hd#[0..63]一一进行测量,来确定问题所在。这是一个处理起来很麻烦的问题,因为ha#[3..31]和hd# [0..63]一共有96根,而且万用表无法插入cpu socket进行测量。所以,一种辅助工具——cpu pin saver(pin护套,见figure.2),应运而生!
将cpu pin saver插在socket上,按照上面的标记(见figure.3、4:dothan或celeron参考figure.3的铅笔划的斜杠,yonah 参考figure.4的大黑点a/d 0.255v左右),测量ha#[3..31]和hd#[0..63]一共96个点的对地阻抗。(在这里,一般会把万用表打到测量二极体的那一档,用电压 信号代替阻抗信号,因为这里的阻抗有时候不好显示出来。只要电压信号跟好板子的差不多就ok了。短路了电压就会很小,断路则没有电压。)如果量到cpu pin saver某点对地短路了,则有可能bga内有连锡了,先找到与该点相连的via,再将cpu socket吹下来,来确定是cpu socket短路还是北桥短路;如果量到cpu pin saver某点断路了,则表示有空焊了,需要去看该点和改点net相对应via,来确定是cpu socket还是北桥空焊或者是pcb的trace断裂。(见figure.1,本人制作的关于cpu与north bridge之间ha#[3..31]/hd#[0..63]的走线示意图,以方便大家理解)排除这些问题之后,就跳到第三步。

figure.1 ha#[3..31] / hd#[0..63] from cpu to north-bridge

figure.2 cpu pin saver(pin护套)

figure.3 护套上代表ha#[3..31]和hd#[0..63]的孔都用铅笔连线作的标记

figure.4 yonah cpu socket reference

第三步:
在cpu和北桥沟通正常的情况下,debug card显示ff(00),则要怀疑bios和ec了,因为flash rom和ec是很容易出问题的器件。
首先看flash rom;主要去看其vcc、vpp及其焊接情况,还有就是采用维修人员找到的一个简单的方法来判断其是否有故障,即:去量flash rom的pin4、pin5、vcc和gnd;flash rom正常的情况下,pin4会保持在0点几v,pin5则为一长串3.3v的高电平信号,如果量到有不同,则需要刷新一次bios,如无法刷新,则更换 flash rom;如果量到vcc= 0v,gnd= 3.3v,flash rom在内部把高低电平倒置了,表明flash rom可能曾经受到大电流的冲击,这时,也可以重新刷新bios,如无法刷新,则更换flash rom。

figure.4 flash rom
然后去看ec和南桥;观察ec的焊接情况,如果不佳,则使用烙铁加锡重新拖过一遍,然后,再去看ec和南桥在lpc上的沟通,即:量lad0至lad3,看是不是每根pin上都有动作。如果不是,很有可能ec坏了;假如更换了ec后,还没有解决问题,就有可能是南桥的不良了,当然这个可能性相对ec来说会小很多。

figure.5 ec-97551 lpc pin
(三)debug card显示停在一个error code上;
0a,28,2c,2e,38,e0
跟北桥、ram、clock generator、ec和bios有关。首先,去看ram有没插好,多拔插几遍(用尽可能多的组合情况),看code有无变化,若有变化,可能是 bios程序被破坏,刷新bios试试;然后看connector:是否ng(一根根pin去量)和pin脚的焊接情况;再去看ram和北桥之间的上拉排 阻(一个一个地量),将阻值不正常的更换掉;还有去看供给connector的几组power,看少了那组就去检查相应的power电路;最后去量 clk_sdram0/ clk_sdram0# ~ clk_sdram4,/clk_sdram4#和smbus上的sdata/sclk看有无动作,若没有动作,则尝试更换北桥或者clock generator。若以上这些情况都排除了,则尝试更换北桥或者ec。
有时候bios资料丢失也可能跑38,重新刷新或者更换一颗新bios。
figure.6 orcad reference
49
initial pci bus and device
跟南桥和每个pci device都有关。首先量pcirst#,如没有则按照之前的方法去找pcirst#是南桥本身没有发出还是被某个pci device拉掉了;再去看每个pci connector/controller的power、clk、smdata/smclk以及焊接情况;然后去看pci device相对应的e2prom;以上都ok,则怀疑ec和bios。
69
initialize the smm handler
sm模式控制器初始化,跟cpu本体有关,有可能是cpu被损坏了,可以尝试更换另一颗cpu。
88
88有时也会造成不显示,跟南桥、ec和bios有关。主要去check南桥和ec沟通的几个pin上的讯号,例如看lad0~lad3上是否有动作,如 果没有则去判断是南桥还是ec的问题(一般南桥出问题的几率会大一些);如果有动作,则怀疑是不是bios没刷好、flash rom没焊好或损坏。

figure.7 lpc
da
跟vga和gm北桥有关。首先去看vga的power、晶振、clock信号、是否植过球以及怀疑其焊接问题,再去check pm北桥和vga之间传输pci-express txn/txp讯号的电容,最后check北桥端。
对于gm北桥,问题比较单纯,不是北桥自身问题就是其外围电路问题。

figure.8-1 pci-e txn/txp

figure.8-2 gm north-bridge refset
三、post到c0以后的不显示和显示不良;
(一)不显示;
error code c0后的不显示,一般为cable没插好、connector本身不良或是电源没有供给:
1.只有lcd不显示,检查lcd connector,量disp_on和lcdvcc power switch电路:

2.只有crt不显示,检查crt connector,量crtvdd:

(二)无背光;
如果lcd可隐约看到影像,那是背光模组出了问题。背光模组和lcd显像模组是独立的两个部分。lcd内部会有ccfl灯管负责发光,系统透 过inverter将直流电压转成灯管所需的1000v左右的高压交流电。inverter只用到5根pin: vin、on/off、brightness、 5v以及gnd,首先应先去量这几根pin,看是否有异常。没有背光除了有可能是lcd本身或 inverter损坏之外,也有可能是主板上的lid switch损坏造成背光被关掉。

figure.9 lid switch
(三)花屏或画面闪烁;
有时显示画面会花掉,造成花屏的原因有可能是vga内寄存器地址数据发生错乱或者受到其他干扰。可先判断crt或lcd是否有同样的问题:
如果crt和lcd有相同的显示,可能是vga本身不良或vga memory部分有问题。当记忆体的资料损毁时,crt、lcd及tv的显示都会有问题;e2prom里v-bios程序有误,也是造成花屏的原因。
如果只有crt出现花屏或闪烁,先去量crt的水平同步hsync及垂直同步vsync讯号,看crt connector端的crt_hs/crt_vs是否有输出。如果没有输出,则可能connector本身不良或者是在vga到crt connector之间的某个部分出了问题。
如果只有lcd花屏,可先确定lcd cable本身是否不良或没有插好,再检查板子上lcd connector是否焊好,然后去check vga端lvds相关的讯号。
(四)颜色不对;
有时候crt会出现颜色不对,因为crt的三原色red,green,blue讯号有缺失。可以根据三原色示意图去判断缺少了什么颜色,然后去check相应的线路:

figure.10 primary colors
(五)run 3d shut down或者花屏;
vga/北桥空冷焊/连锡、vga power储能滤波电容漏件或损坏、v-bios没刷好等