迅维网

查看: 6027|回复: 5
打印 上一主题 下一主题

广达维修报告

[复制链接]
跳转到指定楼层
1#
发表于 2008-9-25 21:40:11 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式 来自: 福建福州 来自 福建福州

马上注册,获取阅读精华内容及下载权限

您需要 登录 才可以下载或查看,没有帐号?注册

x
转一博客,不知道大家有没看过?

一.

我拿到的这块板子错误原因是“BIOS Data Error”。我看了一遍这块主板,发现它的北桥,南桥,PCU ,BIOS FLASH ROM 都已被换过,我觉得这块板子问题比较大,涉及到BIOS的问题一般比较难以理解,刚开始我还以为是 BIOS的程式码错误,但在我给系统上电之後,发现80 port display card 显示 C0。这时候我判断不是BIOS程式码错误。於是我找来 HDD, Keyboard 和 LCD,然後重新启动,按F2 进入Setup 画面,发现原来是 BIOS Revision, S/N number , service ID 有错误。我知道这些资料是在组装线最後阶段扫描进去,并进行reload 动作之後写入EPROM 的。於是我又找来了一片测试HDD, 执行reload 工作,我用键盘输入 Bar Code Number, 但是无法通过,显示写入“FAIL”,还有一条错误资讯“MAC address format  wrong”,我觉得可能是lan 的EPROM 有问题,所以就用示波器测试U14 的信号,发现EESEL , EECLK 均正确,但仍然无法写入,抱着试试看的态度,我更换了U14 。为了使写入的资料准确,又到退修处使用了USB 扫描设备,但reload 程式还是无法通过,这时我想到可能是存放BIOS Revision, S/N number , service ID 的EEPROM 损坏,用示波器量测U27 发现MBCLK 信号正常,但data 资料看不懂。我判断极有可能此EEPROM 损坏,於是又换了U27, 这时候又进行reload 动作,终於 “PASS” . 接着又在退修处进行 Function Test , 全部测过,在组装线投料之後,Run In 也PASS.  这时开机进入SETUP 画面发现BIOS Revision, S/N number , service ID 已经写入,这块M/B 修好了。


   


   






结论:


1.U27损坏导致BIOS Data 无法写入。


U27是一片8K Bit 的EEPROM ,通过SM BUS与PCU相连,U27存储的资讯包括MAC address , serial number ,service ID, 料号,HDD 和Memory的大小等。这些相关资讯是在组装线进行reload 动作时写入的。


        2.在修理过程中,应该注意IC 的PIN 脚是否有连焊或空焊问题,有时候不开机往往是这种容易被忽略的问题造成的。






                                                   


首先拿到这块KT9的铁板,看到上面贴的红色标签上注明的是1394ID码无法烧入。我测量了它的开启电压都是正常,并且可以顺利进入XP系统。然後就把目标锁定1394晶片和它的EEPROM,当测量它的PCLK_1394时发现有跳变状况发生,而正常情况下是不应该发生跳变的,所以换掉1394晶片和EPPROM并重新进行function测试,结果就出现了死机现象。在开启电源正常的情况下出现死机,就考虑到是不是RTC的问题,因为RTC里的有些资讯是BIOS通过调用中断功能获取的,所以我又对RTC晶片进行了信号测量,发现它的值与正常的值不一致,在看看这颗晶片也没有出现焊锡方面的问题,於是我就把它取下来,换了一个再进行测试,这是可以进入XP系统了。於是我再把它做function测试,看能不能烧入1394ID码,结果是可以成功烧入ID码了。这基本上就是这块板子的修理过程。


通过修理这块铁板,我感觉在修理铁板的过程中,除了测量关键的信号外,还有就是把一些不确定的信号与好的板子的信号进行比较分析是一个很重要而且很有效的方法。






三.

         

KT9D的铁板。粘在板子上的粉红色修理跟踪卡标记 Fail Symptom 为 LCVD1, 既无萤幕;跟踪卡的背面写有 FF(应该是指80 port card 的指示)和按压南桥後电流有变动;SB, NB chip 都有更换过的标记,PCU chip 也有重焊过的痕迹。


起初我认为我能修复这块板子的可能性不大,只想观察一下电流的变化,就把CPU, RAM等治具先让给其他人使用了。准备好了之後,我就开始做。我想先看一下在没有CPU, RAM时板子的状态。装上LED&SWITCH Board, 插上电源(我使用Power Supply),按Switch Button, Power Supply 的电流显示在0.4? AMPS~0.2? AMPS 间变化,应属正常,这时板子没有发现其他异常。接着,我重复开关了几次电源,电流变化与第一次相同。同时,我发现LED&SWITCH Board的LEDs有闪烁,此现象可重复,只要一有碰到板子,几个LED就有闪烁。查看板子的LED&SWITCH Board 连接器,焊接良好。据此,我认为可能是主板上驱动LEDs的电路出了问题。查看主板电路图驱动LEDs的部分,LEDs由U12(SN74AH374PW-8Bits Flip-Flop)驱动,U12(SN74AH374PW)的CK Pin由 U43(7WZ32-Two 2 Inputs OR Gates)驱动。用Scope的CH1观察U12的VCC(5VPCU),GND,G#均正确、无抖动,观察U43的VCC, GND 也均正确、无抖动。同时发现,在示波器的探针触及U43及其附近时,LEDs就有闪烁。拨掉电源,把U43重新焊接一遍,接着插上电源按Switch Button,在轻碰主板时LEDs仍有闪烁。找来一颗7W32更换U43, 在更换时,原来的Chip 的第8 Pin 有掉下。插上电源,按Switch Button, 不但期望的LEDs不再闪烁的结果没有出现,主板根本就不上电。我很是着急,正好午饭时间。午饭後用示波器观察到5VPCU正常,-NBSWON正常,-DNBSWON没有出现。问题应该是出现在 U24(PCU-PC87C570)这里。虽然U43就在PCU旁边,但我在更换U43时没有触及PCU, 它损坏的可能性应该很小。再找来一颗7W32更换,仍旧是不上电。在整个过程中我没有一点野蛮操作,我认为损坏chip的可能性不大,开始仔细观察U43及其附近有无Open, short, 没有发现。反复试验,问题依旧。就在我反复试验没有结果时,发现在PCU的两个Pins之间有一很小的锡球,可以活动。我想用镊子把它拨出来,却卡地更紧,於是使用烙铁把它加热熔掉,又把其他的Pins重焊了一遍。(由於当时我不确定就一定是那个小锡球在作怪,PCU的Pin 很多,我就没有记下锡球到底是在哪两个Pins之间。--- 我应该记下的。)插上电源,按Switch Button,有上电,Power Supply 的电流显示在0.4? AMPS~0.2? AMPS 间变化,正常,LED&SWITCH Board上的LEDs不再闪烁。这时同事已经把治具还过来了。装上CPU,RAM,再插上80 Port Card, 加电试验,80 Port Card 跑到C0H。再装上键盘,LCD, 装有测试程式的硬碟试验,测试程式可以启动运行,运行了几个Single Test, Pass。此时,我认为这块板子可能已经好了,於是便拿到SMT 退修区全功能测试站做测试确认,结果一切OK。

结论:1、这块板子原来的Failure Symptom 无萤幕在维修人员更换SB, NB, 和处理PCU Chips後已经解决。2、板子的U43坏件造成Contact Issue,使LED&SWITCH Board的LEDs有闪烁,在更换後解决。3、夹在PCU两个Pins之间的可以活动的小锡球有时会造成Short,在加热熔掉後解决。


四.

症状是:80口循环显示FFH与00H。


我用示波器量了SUSB、SUSC、NPWROK等,发现前两者正常,而後者呈现一忽高忽低的形式。同时,与NB、SB相连的PWROK信号与NPWROK具有相同的形式。同时,CPU的复位信号也爲循环的忽高忽低形式。我认爲SOCKET可能不正常。换下SOCKET,开机, 一切OK。


于是,我拿到楼下测试,发现有时屏幕呈兰色。于是,我又换下NB,发现又恢复FF。我认爲在换NB时,影响了SOCKET。于是, 再换SOCKET。一切OK。


     然後,拿到楼下测试,一切OK。


     这就是整个过程。


五.

主要症状是:当系统重新啓动时,OS运行不下去,80口显示4A。


4A表示“initialize all video adapters in system”. 我们做了大量的实验。现象爲:每次重新上电开机,系统都一切正常。系统正常啓动以後,无论怎麽运行,系统都很稳定。通过软件重啓动的话,系统出故障。通过硬件重啓动的话,无论前後两次的时间间隔多短,系统都正常。我与HOM进行了分析,初步认爲是显存质量有点问题,或者是各显存之间的参数差异造成的。所以我去BGA室换了两片显存。换下以後,自己进行测试,发现有时不能进OS,80口显示59H。基本认定显卡控制器有空焊。换下此控制器。开机,一切正常,且原故障消除。


     然後,拿到楼下测试,一切OK。


     这就是整个过程。

[ 本帖最后由 踪影 于 2008-9-25 21:42 编辑 ]

2#
发表于 2008-9-25 21:40:27 | 只看该作者 来自: 福建福州 来自 福建福州
六.

.

一、 主要治具、工具及仪器:CPU、CPU cooler、Memory Module、 power supply、adaptor、 scope、soldering station、一块power 正常的不良NT1板


二、 修理过程:


这块扳子PCU与power相关的元件有rework 的痕迹,无其他不良痕迹。在不加CPU和RAM的情况下按switch button 後没有任何现象:80 port card 上的 LEDs不亮,板子上的 LED(包括switch button 的只是LED)指示灯不亮。


根据现象,首先猜测power supply 通路可能有故障。我想通过电压量测查出故障所在。为避免意外情况造成额外的损坏,我拆除了 CPU 和 RAM。从power supply 通路的前段也就是电气上比较靠近 adaptor jack 的元件开始,选择相对容易损坏的元件如fuse、diode、MOSFET等量测它们的端电压,量测到自己不确定的点就与一块power正常的板子对比。最後找到最靠近daptor jack的没有电压的点是PD24的positive 端。拔掉电源,使用万用表量测 PD24 positive 端到PD34 negtive 端 之间trace 的电阻,结果为open。其trace 在 bottom layer 和 a internal layer 各有一段,靠近PD24的positive 端的一段在在internal layer, 靠近PD34的negtive 端的一段在在bottom layer, 在後一段靠近via 的位置刮掉一点防焊绿漆,使用万用表量测这一点到前边两点的电阻, 确定前边的一段为open。因其在内层,使用一条代替。


使用跳线代替内层open trace 後,试验,仍旧是按power switch 後没有任何现象。继续使用万用表检查上次检查过的电路後边的元件,经过一些测量後确定PQ20 MOSFET short, 找来同型号的一MOSFET更换。更换後,板子上的LEDs开始闪烁。


安装cpu, cpu cooler, RAM, 80 port debug card 後加电,80 port debug card 上的 LEDs 不亮,应该是没有执行post程式,板子仍有较大的bug。开始检测power sequence, 使用示波器查看每次按power switch後的主要power控制信号和voltage rail, 没有发现问题。继续检查其他的一些主要的voltage rail, 最後终於发现给NB、SB和VGA chip 供点的1.5V voltage rail 与地短路。通过拆掉元件和翘起相关引脚的方法确定short没有发生在供电电路,而是发生NB, SB和VGA三颗chip中。这三颗chip的1.5v power连接在一起, 不能直接确定short发生在其中的哪一颗。使用示波器检测VGA chip 的PLL, 振荡正常,SB chip的RTC振荡正常,这说明这两颗chip没有完全死掉,再检查NB chip, 没有发出CPU Reset 信号。据此推测问题最有可能发生在NB chip这里。我想好了下边的debug过程:先拆掉板上NB chip, 不更换,检测1.5V voltage rail 与地是否还短路,如果short排除,说明NB chip有short;如果short不能排除,继续拆SB Chip,不更换,再检测1.5V voltage rail 与地是否还短路,如果short排除,说明SB chip有short; 如果short不能排除,继续拆VGA chip, 如果short排除, 说明VGA chip有short。(注意:每次拆除chip後,1.5V voltage rail都可能会增加分开的部分,各个部分对地的都要检测是否有对地的short)。随後我就带着板子和万用表去M1 BGA rework 处,跟工作人员商量好後,让他帮忙拆掉了NB chip, 我马上使用万用表检测1.5v Voltage rail 对地电阻,不再有short, 再请其装上一片新的 NB chip, 再检测1.5v Voltage rail,对地没有short。


带回装上 cpu, cpu cooler, RAM, 80 port debug card後80 port debug card 可以跑到C0H。再装上测试用硬碟,LCD panel, keyboard 後试验,机器可以正常启动进入windows OS或者DOS 测试环境。带到M1退修处做全功能检测,中间发现插入测试用microphone後测试用speaker有啸叫,并且测试modem Fail。发现板上电话跳线有过热的痕迹,剥开绝缘,发现两根线因过热短路,找来一条更换後,modem 测试pass。把扳子带过重测Audio, 接上头戴式耳麦播放一段音乐,播放正常没有啸叫。我怀疑M1退修处的测试环境有问题,又将板子带过去请其重测,插测试用microphone後测试用speaker仍有啸叫, 我注意到测试用用的microphone的放置位置离speaker很近,将microphone从speaker处拿开。啸叫消失,应该是测试用speaker的磁场使测试用microphone产生的啸叫信号。

至此这快板子通过全功能测试。

---其实维修过程并没有这麽顺利,因为写报告的时间距离修好板子已有几天时间,中间的小曲折记得不是很清楚,报告中没有记录。---


三、 简单结论:1、这块板子power部分有一内层trace断路,使用外部跳线代替。2、PQ20 short, 使用good component代替。3、NB chip VCC(在NT1中使用1.5v voltage rail)对地短路,更换good chip。4、另猜测,power 部分 trace 断路 跟PQ20 和NB chip的短路之间存在联系。



七.

   NT1 M/B 的维修过程(1)


首先,领到板子以後先用万用表量了一些在power sequence 中的关键信号,发现一切信号都正常。用80port看现象,80port跑到4AH停止。测量AGPST[1::3] 和GNT# 信号再与好板子比较发现它们的信号不正常,认为是显卡的问题。换掉显卡後,显示正常。接上一边RAM,HDD,LCD Panel发现可以进入XP系统。随後到工作栈进行测试。测试不能通过。可以分析到有一个RAM附近的电路一定有问题,这才会出现测试时的现象:两块RAM同时插时不能进入XP系统。


装上另一边RAM时开机时80port跑2C。分析认为,此现象可能与RAM connector有关,也就是说有一个RAM附近的电路一定有问题,这才会出现测试时的现象:两块RAM同时插时有问。仔细观察,发现connector上面短路,断开後还是不能进入XP 系统。


然後我看了与RAM相关的电路发现2.55VSUS这个信号很关键,在DDR Chip上很多Pin脚都用到它,我量了几个Chip上的VDD pin,发现2.55VSUS都正常,但当我量测DU/RESET pin时发现2.55VSUS有跳变的迹象,而另一个RAM插槽此信号就正常。於是问题就集中在与它相连的R247这颗电阻上了。我仔细看了一下这颗电阻也有明显的虚焊,但重新焊了一次。系统正常。


八.

                   NT1-1st板子的维修心得


    板子的症状是80PORT不跑,显示00F。首先我先检查power信号,从上电开始,-NBSWON,-DNBSWON,-SUSB,-SUSC,一直到NPWORK。发现POWER部分的信号是没有问题的。然後我又开始检查CLOCK 信号,CPU,NB,SB的CLOCK都上没有问题的,然後又开始量了CPU RESET ,PCI RESET ,SB 和NB的RESET 发现都是没有问题的。接下来我就开始测量有没有位址资料的传输。在PC87570中没有资料的读写。我又检查了PCI的FRAME信号,发现FRAME没有资料的读写,一直都是高压状态。那如果是这样的话,逆向看,出现的问题应该在主干流向PC87570的上面,我又开始检查CPU 的ADS信号,发现没有资料的读写,我又检查了一个位址线的资料发现一样没有信号。我又换了一个CPU从新测了一下信号,结果是一样的,我怀疑是CPU SOCKET的问题,我去换了一个SOCKET,发现可以进入系统了。


九.

首先,拿到板子后观察现象是跑马灯会停在2C。通过以往的经验,如果跑马灯停在2C或者2E,说明与RAM地址线相连的排阻一定是出了问题,因此我就来量测这些排阻。这些排阻的阻值为22欧姆和0欧姆,同时与它们相联的排阻的阻值有33欧姆和56欧姆。一开始量测时,我量测的是22欧姆和0欧姆的一端的对地阻值,但发现它们的阻值很大,一般是十几兆,这样它们很微小的变化是看不到的。但是微小的变化对于22欧姆和0欧姆的电阻来说也是很重要的,因此我决定量测22欧姆和0欧姆的排阻对RAM的电源的阻值(一般来说阻值为56欧姆和33欧姆左右)。实际上就是量测与它们相连的33欧姆和56欧姆的阻值是否正常。通过量测发现有不正常的电阻,同时量测与之相连的22欧姆或0欧姆本身的阻值。如果也不正常就先换掉22欧姆或0欧姆的电阻,如果还不正常再换掉56欧姆或者33欧姆,依此类推一直量测下去。直到问题解决。


   之后,开机进系统时发现可以跑到C0了,但是LCD不显示可是背景灯被点亮。因此我量测LCDVCC这个电压值,结果LCDVCC的值为零。


再继续往下找量测通过两个三极管和一个MOS管产生LCDVCC的相关电压——5V, 12V, 3V。结果发现12V没有。而12V电压是由芯片MAX1632产生,并且MAX1632会自己产生一个19V电压反馈回来产生12V.量测后发现19V存在,但再MAX1632的12Vpin脚处量测不到12V的存在。我取掉与12V直接相连的PQ50和PR123来量测,结果12V仍然没有,所以我断定一定是MAX1632有问题。换之后显示正常。


在测试时,测试不到CPU温度。而与测量温度有关的那个Component(U20) 本身是发过ECN disqualify 的Component。换过之后一切正常,测试通过。




十.

拿到板子发现的第一个问题还是跑马灯停在2C,问题的解决方法和以前的方法一样,这里就不再讲诉。


第二个问题是开机后发现LCD显示偏移,并且是乱码,但CRT显示正常。通过现象分析,我觉得产生这个现象的原因可能有两个,一个是显存可能出现了问题,一个是供显示的某一个CLK信号有抖动。又在KT7中显存是集成在北桥中的,同时量测北桥上重要的信号都正常,又CRT显示正常,所以初步认为北桥没有问题,即第一个可能性排除。对于第二个,当AGP总线传送信息时,GNT#信号和ST[0::2]信号要同时有效,通过和好板子对比量测发现ST[0::2]信号不正常,而ST2信号是ST1信号通过U40这个芯片展频得到的,所以决定换掉U40。换过之后显示正常。


第三个问题是测试时发现LAN的MAC地址读取不到。LAN的MAC地址是存放在U1中。通过量测U1发现EESEL信号是无效的,同时EECLK信号也没有时钟频率的输入,同时联想到开机后USB鼠标不好用,可能是由于给挂在PCI总线上的设备的传送33MHZ的U11出了问题。量测它的输出果然没有,所以决定换掉。换后,LAN的MAC地址读取正常。


第四个问题是串口和并口测试不过。对于它们我想应该是比较简单的。要么是空焊,要么就是Controller出了问题。重新焊过一遍还是不行,又换过南桥和U17后测试通过。


第五个问题是再次测试是发现声音没有和电话测试不过。观察发现MU2(AMC97)这个芯片没上,所以认为这两个现象可能是由于同一个原因产生的。焊上之后发现声音是左声道响而右声道不响,同时MODEM测试还是不过。通过量测发现控制声道输出的芯片U26信号不对,再仔细观察发现其焊接反了。更换之后还是不行。分析认为可能是把刚刚换好的MU2(AMP97)芯片损坏。再换MU2(AMP97)后问题解决。


第六个问题是测试PC卡时读不到。因为以前碰到过这个问题,经量测后换掉电源控制芯片U5,在进行测试通过。

回复 支持 反对

使用道具 举报

3#
发表于 2008-9-25 21:41:03 | 只看该作者 来自: 福建福州 来自 福建福州
十一.

一开始看到这块板子的 Fail Symptom 是:开机时Q37 很烫,同时80 port显示FFH.


1.    利用power supply发现板子的待机电流爲0.03A到0.04A,而正常的待机电流应该是0.02A到0.01A之间。同时开机是的电流也超出了正常值。经过查看电路图,发现Adapter 插上後是通过Q37 産生PWR_SRC,同时通过PD1,PD2和PC5産生分流电路。经量测发现PD2和PC5坏件。分析认爲,由于分流电路断路,当插上Adapter开机後,所用的电流都流过PQ37,超出了其本身的Tolerance ,所以发烫。换掉PD2和PC5问题解决。


2.    80 port 显示FFH是由于BIOS 的资料没有被读到或读到的资料不正确。问题可能CPU,CHIPSET,PCU87570 这些大CHIP 本身是坏件或者是其他一些与它们的重要信号相联的器件损坏,导致一些重要信号没有接受到或没有送出。由于拿到的板子是已经换过南桥的,又板子能正常上电开机,所以个人认爲PCU87570和南桥的损坏可能性比较小。经过量测ISA BUS的DATA 和 ADDRESS綫发现没有信号,而PCI BUS 也没有DATA 和 ADDRESS綫的信号。最後发现CPU的CLK信号CPUCLK+ 和CPUCLK-没有被送到。检测这两个信号綫的通路发现连接在北桥的Clock generator与CPU之间的电阻R723被撞坏。接跳綫後,80 port显示正常。


3.    开机後进入windows xp作业系统时,发现USB滑鼠不能用。而且插上USB滑鼠时再开机,作业系统在检测外部I/O时会当机。分析认爲,此种现象産生的原因可能是由于在作业系统检测USB幷安装驱动是找不到USB I/O。所以怀疑当插上USB设备时有信号被短路。经量测发现USB的connector与 电容C25短路。断开後问题解决。






十二.

在经过多次反复的情况下,我的第一块KT9 板终於完全测试通过。回想这次维修经历,收获真的不少。






从去年发下这块板子之後,我就一直在进行信号的量测和分析。症状和大多数板子一样,不开机,80port 跑 FF。在清楚我的板子的状态之後,我决定从Power Sequence 的最後一个信号开始往前面量测,当时测到HWPG_POWER (PCU的输入信号)正常而NPWROK (PCU的输出信号)跳变时,我觉得好象找到了问题所在,因为输入正常而输出不正常,应该是87570的问题。但情况却不是那样,因为当时有Luke和Lucky的板子的状态和我的一样,换过87570,情况仍然没有变化,而经理也证实说这完全可能是NPWROK以後电路影响的结果。於是我们又从相关的电路量起,这一步工作我们进行了很多,包括拆换一些小的零件,包括找到所有的相关电路进而缩小范围量测波形,但进展并不大。後来,我决定量测一组由NPWROK作为触发条件,而CPU_RST和CPU的PWRGOOD作为相关信号的波形,而这一次量测,对以後我们问题的判断和我对波形的理解有很大的帮助。当时我量测了很多组信号,最後我对这些信号进行了组合,最终形成了两组不同条件下的完整的波形,并且记录了相关的参数。同时,Luke和Lucky包括Hom 也注意到了这个波形,他们想到,我们所量测的信号应该是正常的,因为,之所以信号变成这样,可能是在设计系统时为了解除系统里的某个bug而设定的。而要让信号正常,可能必须在CPU正常RESET後成功的从BIOS里抓取到某个命令才行。而从波形的情况来看,这样的假定又完全可能成立,因为CPU在RESET後要经过大约2秒的时间才又会被NPWROK拉低,在这2秒内,CPU完全可能从BIOS里面读取很多资料并做相关的处理。






应该说,到了这一步,工作有了很大的进展,因为我们的观念发生了变化,把问题锁定在了CPU复位以後,而认为上电过程完全正常,於是我们开始开始量测各个汇流排的信号。我从87570到BIOS的介面汇流排上的资料读控制信号开始量测,发现有一直往复回圈的读数据动作,符合我们的推理,进而,我又量测了从Southbridge到87570的ISA汇流排,发现ISA上的读资料控制信号完全没有。当我进行到这一步时,Luke和Scott那边的情况有了新的进展,当他们发现CPU发出的ADS信号不正常而各个汇流排上的位址信号都在动的时候,他们怀疑可能是CPU Socket的问题,经过量测,果然ADS信号断路,确定Socket空焊,Luke去换了Socket後,板子正常运行;後来,Scott也换了一块Socket後板子完全正常。在他们的启示下,我又赶紧量测了PCI汇流排上的Frame信号,发现正常,然後我又量测了ADS信号,发现没有出来。这时看来就有两个问题,一是Southbridge发给87570的信号没有,一是CPU到Northbridge的ADS信号没有。然後我去换了Socket和Southbridge。回来再进行测量时,发现ADS和ISA上的读控制信号完全正常了,但还是不能开机。然後,我又多次反复的量测了主干线上的各个位址和资料信号,包括好多找不到测点的读写控制信号,发现都在动作。唯一不能确定的就是位址和资料线上的资料是否正确。






最後,我请Luke帮我查找一下问题。经过Luke的努力,他发现我这块板子的ADS信号虽然有,但看起来拉的不够低,於是他推测可能是在换Socket的时候仍然没有焊好。於是我再去换了一次Socket,回来一试,果然能很好的开机了。这中间出现了一个小的问题,那就是在开机的时候,系统报告Video Initial Fail,但後来我们上好风扇以後,问题就没有出现了(後来,这一点有助於我下决定换Northbridge)。於是,我去做Function Test,发现系统检测不到CPU的温度,後来我们换了一块U3, 问题得到解决。可是再做测试时,发现系统又出现了不稳定的情况,当时的第一个反应就是Socket再次没有换好,可是我突然发现可能Northbridge也会出现问题,於是就再多次进行用按压的方式进行试探性的测试。可是,用按压的效果其实并不明显,不能最终决定是哪一块没有焊好,而是发现系统在每次上电时,当温度上升到一定程度的时候就能自动开机。我决定用多次开机测试的方式来找问题,後来终於发现,系统在开机的过程当中,会随机的停在一些位置,而这些问题又都是由於检测不到BIOS的某些资讯产生的,有时甚至会出现Chipset初始化Fail的问题。仔细一想,系统在开机的时候要先把BIOS的内容拷贝到System Memory中,而这块板子往往又停在BIOS的检测上,加之前面提到过的Video的问题,所以我决定换Northbridge。没想到换了Northbridge後,虽然开机不稳定的问题解决了,但又出现了CRT显示缺少蓝色的现象,又查了RGB的相关电路,确定线路没有问题,就只能又是Northbridge没有换好了,然後再换Northbridge,问题终於全部解决。






总结起来,这块板子居然换了2次Socket,2次Northbridge,而最根本的原因都是由於空焊或者虚焊的原因。所以,在BGA封装的焊接是否良好的问题上,我们应该多留意一点。整个过程中,我得到了诸位同事特别是Luke的全力帮助,在此表示感谢!






十三.

NT1主板,和KT9相比,NT1主板的结构有很大的变化,当然,最明显的就是其PCB的外行轮廓和KT9的差别了。


由於这块板子在我手中本身并没有进行怎样维修就已经测试通过,所以我的心得就主要是NT1和KT9的区别以及维修前的准备工作了,以便大家在维修时能有所参考。NT1在北桥晶片上通过AGP3.0外接了一块nVDIA的显卡,增进了其显示功能,但是,我们从生产线上了解到,很多有问题的主板的故障也出在和这块显卡相关的电路上,这也是我们在Q NT1板子时应该注意的情况。而在北桥和南桥之间,则采用了Intel公司的HUB Link而不是KT9系统里采用的PCI汇流排,因此,需要仔细了解的新的内容就是HUB Link的资料传输特点以及要怎样去量测在这上面传输的资料了。 另外,南桥晶片的功能比KT9的更为强大且其功能发挥的更为充分,NT1有4个USB介面,他们的Host Controller集成在南桥里面而没有单独的USB控制器。其他的周边设备,比如LAN, IEEE1394, MINI-PCI和PCMCIA的控制器都是通过PCI汇流排挂接在南桥上面。通过LPC汇流排,南桥除了接了PC87570之外,还接了一块PC87393(Super I/O)连接并口和FIR。PCMCIA控制器上接了两个Slot,一个是CardBus Slot,一个是Memory Card Reader Slot。在Audio方面,AMC Controller接了一个笔记本内部的Microphone通道。我的经历是,在我了解了这些区别之後,我开始进行Debug,结果是我这块板子能很好的进入Windows XP,因此我决定拿到线上去做功能测试以便确定什麽地方除了问题,没想到的是,功能测试一次性完全通过。


十四.

NT1板子的主要问题就是显示不良,按Power Switch後,80port停在59H,然後系统自动重启,反复几次之後,能进入Windows XP,但是LCD显示的解析度有问题,图像向右倾斜并且变大,进入XP以後,看不到桌面图示和滑鼠。






拿到板子後,我发现连接到B channel显存U38的一块排阻PN15没有,并且U38晶片中央有一块凸起,明显有问题。於是我换了一块U38并且焊上了那块排阻,但问题并没有得到解决。接下来的工作就是量测一些信号,包括确定和Video相关的电源和地信号等等,後来我们借了一台CRT,发现CRT的显示没有解析度的问题,只是有一些杂讯,看起来就是VGA port没有问题,但LVDS有问题了,而且由於系统能引导进入Windows XP,北桥不可能出问题,因此显卡出问题的可能就性很大,可是换了一块显卡後,问题不但没有得到解决,而是一直停在59H了,我想很大可能是换显卡的时候没有换好,所以就又去换了一次,问题没有解决,但恢复到以前的情况了,由此可以确定,问题不是由显卡本身引起的。於是我努力的思考到底哪里出了问题,由於以前一直认为北桥没有问题,所以没有去量过AGP汇流排,於是我开始着手量测AGP汇流排,我首先量测了两组AGPADSTBF0和AGPADSTBF1信号,发现这两个信号没有,这时我马上意识到可能在显示初始化的时候AGP汇流排上的传输应该是PCI模式,於是我量测了AGPFRAME信号,信号在80port 59H的时候有,然後在完全进入XP後又出现。我找了一块好的板子进行对比,同时我也量测了AGPSBSTBF和AGPSBSTBS信号,立即得到了一个很好的结论,那就是系统在initial post display service的时候用的是PCI传输模式,而在导入Windows程式的时候用的是Side Band传输模式。然後,我又对比的量测了坏板子的情况,发现坏板子的时序逻辑正确,但是信号紮乱,因此系统出现问题,但北桥应该没有问题了。






从现象来看,这块板子的显示问题主要出在display initial上,如果这个问题解决,整个显示问题就会得到解决。然而显示初始化出问题的可能性只有4种:1,北桥有问题(根据所量测的AGP信号被排除);1,显卡有问题(已经换好,被排除);3,显存有问题(待确定);4,和显示相关的BIOS有问题(因为Lucky换过BIOS但no use被排除)。因此,问题集中在了显存上面。可是这时却有一个问题,那就是4块显存,到底哪一块出问题了呢?要量测信号的话,通过示波器难度很大,不太现实。Hom 提出了一个想法,那就是先取下两块即一个channel的显存下来然後在看开机情况,我取下了B channel的两块显存,因为这两颗被换过,出问题的可能性也较大。可是开机的时候我们立即否认了显存出问题的可能性,因为取下後,在萤幕上的反应只是显示区域以垂直条纹间隔的方式减少了一半,而没有其他现象,但是在59H没有出现重启了(但这一点当时没有的到我们的重视),因此我们认为现存出问题的话不会影响解析度。後来我们决定从LVDS介面上找问题,我们对比了好坏板子的I2C汇流排信号,发现完全一样,但坏板子有一组时钟信号没有,通过确认,线路没有问题。看起来还是显卡没有发出正确的时钟信号的问题了,但显卡本身确实有没有什麽问题。在找不到突破点的情况下,我决定重新把取下来的两块现存焊上去,让我们惊讶的是,所有的问题都解决了。做功能测试,完全通过。






到这里,应该说,我们的Debug过程还没有结束,因为我们还不能确定显存出问题为什麽会导致萤幕解析度的问题。这需要我在接下来的工作中进一步的学习和研究。当然,有一点,那就是,显存的出错导致了初始化的不成功,那是不是初始化不成功致使一些初始化被忽略造成了解析度的问题呢?这里就需要和video BIOS的工作人员进行沟通解决了。

回复 支持 反对

使用道具 举报

4#
发表于 2008-9-25 21:41:33 | 只看该作者 来自: 福建福州 来自 福建福州

另一篇

DELL基本维修手册                                          

基本维修手册


前言:


       各位在使用这本维修手册前必须先了解基板的基本架构,因为每一块M/B的架构都不一样目前是以Intel 架构最为普遍所以初学者最好以维修Intel 架构之M/B为第一优先,另外在维修前你必须先了解各种维修工具的操作方法及使用时机。并且请了解各机种的BIOS Error Code 代表的意义。

在所有的M/B 拿你的手上时可以先行目检,其实有部份的不良可以目视的方式看出来,所以目检是非常重要的,当然若是你了解M/B 的架构可以从各不良点针对该Function 目检也许可以很快的找出问题出现在那里。

在维修时有部份的不良板须更换零件,你在更换零件之前须要先确认零件不良不是因制程不良造成的问题,所以在更换零件之前请先把可以重新焊接的部份(BGA 零件无法重焊故不必重新焊接),再行重焊一次如此可以减少零件误判或是责任单位归属的问题。另外若你判定不良问题是由於制程不良造成的问题,请在拆下零件後再针对该零件的不良讯号再行确认,以确保非零件造成的误判。(如:你发现某一零件的某二个讯号Short ,在你拆下零件後请再量测此零件的此二个讯号是否short ?若不是Short 再判定为制程造成的不良)。

其实维修并不困难,只要你的观念清楚,找问题的方向正确基本上80%的不良板都可以找出不良点。





目检的流程:

1.DIP (板背)部份:检查是否有空焊,Short 的现象,每一部分都要看过一遍。

2.Jumper(PSWD) 、排针:是否缺件、或因撞击造成排针Short , 或是Jumper 内部端子松动而Open ,是否有位移或位置错误的现象?另外目前有些M/B Jumper 部分已改成Dip  Switch ,所以在目检时也要先check DIP 调整的位置是否正确?

3.SMT 部份:ChipSet , SMD 之TTL 零件,电容,电阻是否有错件,极反(电容、电阻没有极性)或Short ,以针经拨Pin 脚是否有空焊,冷焊的现象?

4.零件面的Slot 内是否有异物,是否所有的PIN 都在?PIN 是否有退PIN 或缩PIN 的问题。

CMOS (NO POWER):

1.开启电源Check 是否有电源?若无电源请即刻关闭总开关并检查所有零件是否有烧毁的现像?若无电源请用电表量测所有电源是否有short 的现象?

2.先作Clear COMS 动作 (C352)

3.量测32.768K HZ 是否正常?

4.请量测PWRBIN 是否有 +3V ?若无,请检查 +5V SB 转 +3 VSB 是否正常?

5.检查RSMRST 是否为HI ,RSMRST为+5VSB的旗标讯号

6.量测 slp_s3 讯号是否为 HI (通常透过此讯号控制电晶体的导通 使PSON# 接地)









CMOS (02) 维修流程:

1.      02 是BIOS 在检查CMOS 是否正常?另外也会侦测Battery 是否正常?

2.      在拿到02 此类的M/B 可先检查其Battery是否正常?

3.      另外也要检查CMOS IC 是否正常?

4.      有些M/B 其CMOS 是整合到ICH中所以在维修时要注意是否有可能是Chipset 故障。

5.      另外目前的M/B 大多是将RTC 内建於chipset 中故在Chipset 的周围都会有一颗32.768 筒状的X’Tal  .这个Crystal 就是提供M/B RTC 线路的时基,以使M/B 的及时时间线路可以准确的工作。





Post1 (FF,00) 维修流程:

1.        量测所有M/B 上之Crystal 是否振荡,频率及振幅是否正确?

2.        量测M/B 上所有的电源(+3V,+5V,+12V,-12V,-5V, Vcore ,+ 3VSUS,+ 1.8V, +3.3VDS,+5VAUX,1.5V)是否正确?

3.        插上Debug Card , Check 所有Address , Data 是否有送出.

4.        若是发现只有Address 请检查BIOS 是否为空烧?(可上ROM Card)

5.        有时BIOS 电源未Input 有会造成无法Work,所以在检查所有信号前请务必确认该零件之电源都是正确,且电压Level都是正常.

6.        量测Clock的原因为PC 是序向逻辑的架构每个Chipset 要沟通必须要有Clock 来加以同步,所以若题系统中没有clock 表示Chipset 和CPU,或是Chipset 与Chipset 无法同步更别提资料传输。

7.        电源是所有电路之母,就好像汽车要有汽油才能走,所以若你收到的不良M/B 其中有任一电源未输入,必须设法先让所有电源有Input 到M/B 中,在你解决了电源问题之後往往原本的问题也许就跟若迎刃而解。

8.        目前的BIOS 元件叫FWH (Firmware Hub) 这颗元件的功能其实和之前用Flash ROM 的方式是差不多只是它的功能较多,而且这颗元件还有Clock 才会Work 所以在维修前必须先Check 是否有clock 再换零件.此元件也有二个RESET 讯号(RST # 及Init#)这二个讯号必须正常FWH 才会动作.另外有一个讯号必须在RST#动作前就必须设定完毕就是IC(Interface configuration PIN),因为此零件有两种Mode 可动作其中一个Mode 是FWH (就是M/B 目前Default 的动作)另外一个Mode 叫A/A MUX (for 烧录使用)。





Post2 (06,09)维修流程:

1.若插上DIMM 发现Debug 停在06 Or 09 即BIOS 在Check Memory 时有问题产生无法进入下一个流程。

2.此时请把每根DIMM Socket 都插上Memory Module .再开机检查状况是否还是一样?

3.把所有Memory Module 全数移除再分别於每个DIMM Socket 上插上Memory Module ,检查是否有任一个socket 插槽是可以Work?若有其中任一Socket 可以Work 表示必须check 所有无法work 的DIMM Socket 的讯号.

4.检查DIMM Socket 无法Work 的流程:请先Check 每根DIMM 的Clock 是否正确,LEVEL &频率是否正确?另外请检查每根DIMM 的Clock 频率是否正确?

5.MEMORY 的架构是采阵列方式排列所以MA 是其Address,在要读取或写入资料之前会送出行 Address 及列Address 那DIMM 如何知道是行Address 或是列Address 就是以CAS , RAS 为准.所以在维修Memory 问题前可先行Check CAS , RAS 是否有动作?(以示波器量测讯号是否有动作?)你可以一直按Reset 使M/B 一直重覆POST 的动作如此你就可以Check 出此讯号是否有动作。若想要知道详细动作及讯号动作的先後顺序可参考SDRAM 的动作原理。

6.另外有些M/B 若未上DIMM 时Clock 并不会送出,所以要检查Clock时请先插上DIMM。





Post4 (27,2A)维修流程:

1.由Error Code 上的定义27代表为Keyboard Controller 在BIOS 基本测试时无法Pass ,所以造成系统停在”27”

2.维修方式请先检查Keyboard 的IRQ 是否正常,Keyboard 的解验线路是否正常?









2E 维修流程:

1.      0d是BIOS 在侦测VGA Card 是否存在的一段程式,BIOS 会在这段时间去检查所有的Slot 是否有插上VGA Card,若是没有插上的话就会

2.      在确定没有缺PIN 後请量测AGP 的Clock 是否正常? AGP Slot 的VCC 电压(+12V, +3V,+5V)是否正常?

3.      若VGA 是ON Board 它的VGA BIOS 是和M/B 合并在一起所以你可

4.      一般而言必须先了解测试线的VGA Card 是插在那个Slot,以目前的M/B 来讲都是插在AGP Slot ,所以在维修时请先检查AGP Slot 的PIN 是否都在,有没有缺PIN 的状况?以先换换BIOS 再检查是否可以开机。

5.      因为VGA Type 是取决於CMOS 中的VGA Type设定,一般是设定在 VGA/EGA 即彩色影象卡。所以若CMOS 内容有错也可能造成VGA 无法动作。(此时可以清除CMOS 看看VGA 会不会变正常)?

Floppy Error 维修流程:

1.Floppy 在IBM PC 上是一个历史相当久的装置,从最早的XT 时代的5 1/2 “ 360 KB 的时代,到现在的1.44MB 3 1/2”的Floppy 其实其功能及速度并无多大的变化。

2.若你了解Floppy 的测试程式你大概就可以了解程式在测试此装置的流程为何,说穿也其实就是先将资料读出来其把资料回写,然後再比较是否正确。

3.一般来讲有两种状况的Floppy Error ,一种是测试时整个系统就停止了有点好像当机的现像。一般而言类似这样的问题有可能是系统和FDD Controller 沟通上出问题才会导致上述的问题。另外Floppy 的存取资料是运用DMA 的方式来运作所以在修这类的M/B 时检查DMA 是否动作是非常重要的。(DMA 运作模式是为了让系统在做I/O 时不要占用到CPU 的时间,一般都是由Memory Controller 来掌控)

4.另外一种可能是Floppy 界面及磁碟机界面的讯号有问题如PIN short 等等问题.

5.另外若Super I/O 有其他的功能也有机会会造成Floppy Ng 的状况.例COM Port Buffer 故障造成Floppy 无法正常work..

6.另外若你想要验证Floppy 与南桥的讯号是否正常可以以其他功能来验证,如先测试Printer 的功能,若Printer 功能正常也许知道这方面的共用讯号是正常无问题.(其实在维修M/B可借由其他的Function 的功能来验证目前不良功能的共用的信号是否正常)













COM Port 维修流程:

1.一般而言COM Port 都是接Mouse 不然就是接Modem ,若是你发现COM Port NG 首先要先检查是否另外一个COM Port 是否也有问题?为何要如此Check呢?另外你也可以把两个COM Port Address 也交换看看问题点会不会因为COM Port Address 转移也跟着转移?如此可以很快的找出COM Port 的Buffer 是否有问题?

2.另外若是交换也无法找出问题,则先要从Buffer 下手请注意RS-232 的讯是在M/B 上是以12V 为准位所以若是在转换过程出问题有可能是Buffer 有问题。(当然在换零件前还是那句老话,请先检查此零件与Super I/O 是否讯号连接都没问题,且要确定COM Port Connector 是否连接正常?)

3.另外COM Port 的IRQ 分别是 3 ,4 所以这也是检查重点.





Printer Port 维修流程:

1.其实Printer Port 和COM Port 的检查流程和COM 或是Floppy 检查流程都是一样,只是它的Address 及IRQ 不一样而己。

2.COM Port 是串列埠而Printer Port 是并列埠,并列埠的意思就是资料是以并列的方式传输,同一时间传8 个Bit的资料 。而串列埠题以串列方式传输资料,同一时间只传一个Bit 的资料。

3.Printer Port 外有一些讯号是用来和Printer 做沟通用,如PE,Busy….

传统的Printer Port 是单向也就是资料是只有Output 没有Input後来Printer Port 有些变革,於是就有双向的模式出现也就是ECP/EPP 的规格出现。

回复 支持 反对

使用道具 举报

5#
发表于 2008-9-25 21:42:01 | 只看该作者 来自: 福建福州 来自 福建福州

再一篇

Repair经验


1.按Power Botton不送电。

a.       Check 5V PCU 是否正常供应到PCU(NS570)。

b.      按Power Button(-NBSWON)是否送至PCU.

c.       570是否送出Power control signal(-DNBSWON),并打开RVCC电源使SB开始动作.

d.      BIOS signal是否有动作.

       2.Power-on LED有亮,但80Port停FF:

a.       检查电源(3.3V/5V/2.5V/1.8V/1.25V/Corevcc)是否有送出并达正常电压准位元.


b.      检查DC-DC之HWPG是否送至570.570是否送出NPPWROK信号给系统.


c.       送SB之PG(PWROK)是否正常.

d.      其他Reset Signal(-PCIRST/-IDERST…)是否正常.

e.       检查Clock Generator送出给CPU/AGP/PCI Device/14M之Clock频率是否正常.

f.        检查BIOS Signal信号是否正常.

g.       检查IC/BIOS Socket是否有空冷焊/缺件现象..

       3.Post Card(80 port)停28:

a.       检查DDR电源2.5VSUS/1.25SUS是否正常,电压准位元是否正确.

b.      量测DDR Address/Data/Control signal/clock是否正常.

c.       检查是否有排阻,空焊/缺件/短路现象.

d.      检查SO-DIMM是否空冷焊.

e.       NB是否空冷焊.

       4.PCMCIA Test fail:

a.       利用Windows检查system是否有认到PCMCIA controller,若有则问题会出现在PCMCIA socket端,PCI Bus没问题.

b.      Check PCMCIA Power controller是否有送电并检查有无空冷焊.

c.       检查PCMCIA Socket是否有空冷焊.

d.      检查PCMCIA相关线路是否有缺,漏件.


e.       考虑CHIP空冷焊.

      5.其他PCI Device(LAN/1394/Mini PCI)Test fail:

a.       利用Windows检查system是否有认到IC,有则表示PCI部分OK.

b.      检查Connector是否有空冷焊或缺件.

c.       LAN 可Check Transformer是否空冷焊或功能不良.

d.      1394可Check接近2颗Common choke有无缺件或冷焊及不良.

e.       Mini PCI可check Socket是否空冷焊.

回复 支持 反对

使用道具 举报

6#
发表于 2008-9-26 20:47:05 | 只看该作者 来自: 上海杨浦区 来自 上海杨浦区
http://sky1964.bokee.com/6260585.html在这面看过,不知道是不是原创

回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表
附近
店铺
微信扫码查看附近店铺
维修
报价
扫码查看手机版报价
信号元
件查询
点位图 AI维修
助手



芯片搜索

快速回复