迅维网

查看: 15773|回复: 34
打印 上一主题 下一主题

南桥坏引发CPU无复位的故障试分析

  [复制链接]
跳转到指定楼层
1#
发表于 2008-10-6 00:04:44 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式 来自: 辽宁沈阳 来自 辽宁沈阳

马上注册,获取阅读精华内容及下载权限

您需要 登录 才可以下载或查看,没有帐号?注册

x
不知道大家在维修INTEL的高端主板(南桥为ICH7以上)的时候,有没有遇到过这样的现象,即CPURST#信号一直为低电平,引起CPU不工作,主板跑FF代码,一般以我们通常的维修思路,通常是先主板其它复位信号是否正常,如果其它信号正常,则查北桥的工作条件(包括北桥的工作电压,频率,以及南桥发给北桥的复位信号等),众所周知,CPURST#是由北桥发给CPU的,如北桥工作条件都正常,还找不到故障点,那就试更换北桥,这种维修思路在维修ICH7以下南桥的主板的时候是比较正确的。
      但现在这种方法却不是百用百灵了,在修ICH7以上的主板,主要是945系列的时候,CPU无复位的故障比较常见,但是用上述的方法却成功率很低,所以有一段时间,我遇到这种主板都感觉很无奈,因为没有什么维修思路,在偶尔的一个机会,我抱着试试看的想法,更换了一次ICH7南桥,没想到作完BGA后,CPURST#信号却正常了,后来陆续修到无CPURST#信号故障的主板时候,如果查不出明显的故障,我都会更换一下南桥,而且维修成功率很高,基本上是85%。也就是说,85%的无CPURST#信号的主板故障是南桥所引起的。
      面对这么高的故障定位率,我在闲下来的时候,不由得感觉很是不解,因为南桥会引发CPURST#信号故障,这对于我传统的修板思路来说,很难于接受。但却又不得不相信这种情况是真实存在的。而我作人的原则是绝对不想糊涂过日子,所以就查询了一些资料,来试着对这种故障现象作一个简单的分析,当然我的分析并不一定是正确的,因为限于设备、时间等条件,所以大部分的文字都是纸上谈兵,这篇小文扔在这里也只是想起到一个抛砖引玉的作用,希望各位高手多多参与讨论,早日给这个故障作一个正确的定义。
      首先,来说一下CPURST#的大致产生流程,当然,只是一个很简单的描述。本文的重点并不在这里,只是为了让大家先有一个了解
      1,ATX的PWROK和VCORE电路的VRM_GD发给南桥(当然,前提是南桥的基本工作条件都正常)
      2,南桥接到这两个信号后,会发出一个最基本的PCIRST#信号,作为一个基本复位信号,并发给门电路或专用的复位IC。
      3,门电路或专用IC将PCIRST#信号分化成PCIRST#1、PCIRST#2、IDERST#等,用来复位相应的设备。
      4,PCIRST#1会同时发给IO、网卡、北桥等设备(这里并不一定就肯定是这样的定义,我只是举例说明,不同的主板依设计思路而不同,所以不要照搬之,要灵活运用,以跑线路的结果为准)
      5,北桥接到PCIRST#1后,对自身进行复位,并在CPU接到南桥发出的CPU_PWRGD信号后,对CPU发出CPURST#信号使之进行复位,清空内存的寄存器。
      上面是传统意义上的CPURST#信号产生流程,但我查阅了INTEL的技术支持文档后,发现在ICH7以后的平台上,复位信号的工作有了一些明显的改变。

以ICH7南桥为例,其接到PWROK和VRM_GD后,会发出PLTRST#及PCIRST#两个基本复位信号,PLTRST#信号用来复位PCI-E平台的一些设备,绝大部分主板是为IO及北桥提供复位,而PCIRST#则用来来主板上的其它IC来提供复位。
即然我们知道了PLTRST#信号是用来复位北桥的,那么就可以推断出PLTRST#是CPURST#产生的必要条件。一般来说这个步骤上的PLTRST#信号是不会有故障的,我曾经专门作过量测统计,由于南桥引起的CPURST#信号故障,在PLTRST#信号上根本就不会出错。所以PLTRST#信号导致的故障我们可以排除掉。
      在INTEL的技术文档中,我找到了下面的一张时序图,如图所示,整个平台在进入S0状态(也就是正常的工作状态)时,相应的信号时序依次是PWROK→VRMPWRGD→SUS_STAT#→PLTRST#→Processor I/F signals→STPCLK#(CPUSLP#)→DMI message。在PLTRST#信号之后起作用的分别是Processor I/F signals(处理器接口信号)、STPCLK#(降低处理器频率信号)、DMI message(DMI介面信息),由此分析,此三个因素可能会影响CPURST#复位信号。



经过几次比较和实验后,我将Processor I/F signals、STPCLK#(CPUSLP#)这两个因素排除了。只剩下DMI message这个信号了。在与一个在工厂作RD的朋友聊天的时候,他透露给我一个讯息,北桥正确的发出CPURST#信号,需要DMI message正常,通俗点来说也就是说南北桥之间的DMI介面传输的信息要正常才可以。
      而在南桥中,与DMI介面相关的信号有如下这些:




  因此,如果发现CPURST#信号不正常,在排除PLTRST#本身及之前的故障的时候,则需要对DMI介面进行检查。如果DMI介面有了故障,则很有可能会影响CPURST#,在我进行维修的时候,曾发现过几例DMI介面故障所引起的CPURST#故障,而比较有趣的是DMI介面故障的主板,北桥几乎不会有坏的,通过割线判断,都是南桥有短路或开路,我想可能是南桥作为输入输出数据的主要控制端,所以损坏率较高吧。
      我的理解就是如上这些,有很多不完全不正确的地方,希望大家来补充并修正。

PS:DMI介面的检修方法,就是打一下DMI介面信号的对地二极体值,以及电压。所谓DMI介面,就是南桥和北桥之间的连接线路。我们可以通过检视主板的外观来找到相应线路。

购买记录

购买人数5价格购买时间
 会员1184925300鑫豆2024-11-23 23:57
 会员1552017300鑫豆2024-9-4 22:55
 会员1943930.5元2021-1-29 21:58
 会员6580580.5元2020-7-28 20:20
 会员3942990.5元2018-8-2 14:48

查看所有购买记录


评分

参与人数 3下载分 +4 威望 +6 收起 理由
新诚达 + 4 + 1 精品文章
孤帆远影 + 3 强人
计将安出 + 2 精品文章

查看全部评分

本文由 会员11 原创或被授权转载制作,其他机构或个人未经许可严禁转载。
推荐
发表于 2008-10-7 07:53:43 | 只看该作者 来自: 辽宁沈阳 来自 辽宁沈阳
并且,如果PWRGD不良,那么CPURST#必定是无效的,除非有一种特定情况,那就是PWRGD线路断线。

回复 支持 2 反对 0

使用道具 举报

推荐
发表于 2008-10-7 01:44:27 | 只看该作者 来自: 台湾 来自 台湾
Intel 在ICH6就舍弃HUB-LINK 改用DMI 了. 所以这类的故障,如果是因为DMI的原因, ICH6也是该怀疑的对象之一. .
我想请问的是, 当CPURST# 有问题时, 此时 CPU_PWRGD 的状态正常吗? 我常遇到的是, 这二个讯号同时不良情况较多.

回复 支持 2 反对 0

使用道具 举报

推荐
发表于 2008-10-7 07:52:55 | 只看该作者 来自: 辽宁沈阳 来自 辽宁沈阳
你好,我遇到的都是PWRGD均正常发出到CPU,而CPURST#却为低电平。

回复 支持 1 反对 0

使用道具 举报

推荐
发表于 2008-10-6 00:31:05 | 只看该作者 来自: 广西桂林 来自 广西桂林
楼主真是强啊,分析思路清楚,让我受益太多.真正的高手文章.LZ维修中发现的一些通病,就是最好的例子了.这个特别的好,--85%的无CPURST#信号的主板故障是南桥所引起的。让大家在修此类故障时少走弯路,多谢多谢.

回复 支持 1 反对 0

使用道具 举报

6#
发表于 2008-10-7 18:49:20 | 只看该作者 来自: 广东东莞 来自 广东东莞
郁闷,听了飞翔老大的这一席话,不觉的流了冷汗
因为最近修的几块板都是 无CPURST#,都判了NB的问题没想到看到这帖之后
哎,技术有待加强呀,呵呵向老学习

回复 支持 反对

使用道具 举报

7#
发表于 2008-10-7 20:16:48 | 只看该作者 来自: 台湾台北 来自 台湾台北


谢谢你的分析, 我想也是. 因为 CPU_PWRGD的时序在CPU_RST# 之前, 这时候如果二个都没有, 最大的问题组件就落在SIO 或 BIOS, 因为有些主板, SB_PWRGD 是由SIO 提供. 遇到这类的故障, 我通常是重刷BIOS无效后, 换掉SIO大部分都可以修复. (当然有些是例外, 不能一概论之)  (ATXPWRGD+VRMPWGD)->SIO->SB_PWROK->SB……….

[ 本帖最后由 王宏钧 于 2008-10-7 23:36 编辑 ]

回复 支持 反对

使用道具 举报

8#
发表于 2008-10-8 06:32:25 | 只看该作者 来自: 安徽芜湖 来自 安徽芜湖
3楼的分析应该是正确的,这个跟南北桥采用串行总线通讯有关系。遗憾的是本本的HUB Link和DMI不好测,对这一重量级总线的测量基本就放弃了。

回复 支持 反对

使用道具 举报

9#
发表于 2008-10-9 20:11:06 | 只看该作者 来自: 广东深圳 来自 广东深圳
我也郁闷945的板,没CPURST我都修上千片了,一直都是这样杀桥杀好的.大部份量不到问题.我请教了些FA他们也没人说得清楚.

回复 支持 反对

使用道具 举报

10#
发表于 2008-10-9 20:25:06 | 只看该作者 来自: 广东深圳 来自 广东深圳
这个问题好象我来论坛没多久我就请教过飞翔老师了.飞翔老师当时的回答是有同感.我就凭着经验一直郁闷修了这么久.还有就是965及G35的板有些板量什么都正常.就是不开机.有做北桥好,有的做南桥好.北桥较多一点.也是很郁闷的事.厂里有条件才是这样换元件.换出经验来的.

回复 支持 反对

使用道具 举报

11#
发表于 2008-10-29 11:30:07 | 只看该作者 来自: 江苏南京 来自 江苏南京
在ICH4中,PCIRST信号送入北桥后,北桥和南桥之间的HUB-LINK总线如果不能正常的传输数据,北桥好像也不会发出CPURST.
不知老大有没有试过.断开一根HUB-LINK总线.CPURST#是否还正常..

回复 支持 反对

使用道具 举报

12#
发表于 2008-10-29 12:29:23 | 只看该作者 来自: 广东深圳 来自 广东深圳
ICH10 EDS描述如下:
Platform Reset: The Intel® ICH10 asserts PLTRST# to reset devices
on the platform (e.g., SIO, FWH, LAN, (G)MCH, TPM, etc.). The ICH10
asserts PLTRST# during power-up and when S/W initiates a hard reset
sequence through the Reset Control register (I/O Register CF9h). The
ICH10 drives PLTRST# inactive a minimum of 1 ms after both PWROK
and VRMPWRGD are driven high. The ICH10 drives PLTRST# active a
minimum of 1 ms when initiated through the Reset Control register
(I/O Register CF9h).
NOTE: PLTRST# is in the VccSus3_3 well.

附件是ICH10的几个时序供参考,没有专门真对cpurst#:
Intel® 4 Series Chipset Platform Sequencing:- ICH10 Sequencing Diagram
Intel® 4 Series Chipset Platform Sequencing:- GMCH Sequencing Diagram
Intel® 4 Series Chipset Platform Sequencing:- CPU VR Sequencing Diagram

ICH10 power sequence.rar

144.37 KB, 下载次数: 107, 下载积分: 下载分 -5 分, 下载 1 次


回复 支持 反对

使用道具 举报

13#
发表于 2008-10-29 22:09:09 | 只看该作者 来自: 广东深圳 来自 广东深圳
回楼上的,我所遇到的故障板,都是PLTRST#正常,但CPURST#却不对的。

回复 支持 反对

使用道具 举报

14#
发表于 2008-10-30 12:32:24 | 只看该作者 来自: 广东深圳 来自 广东深圳

昨天刚遇到的:技嘉945gcm-s2l无CPURST故障

经过仔细量测,该板所有电压均正常,SB正常发出PCIRST至PCI,-PFMRST至IO和NB,NB的MCHCLK+,MCHCLK-,SRCCLK-及SRCCLK+,各组电压也正常,量测DMI16条信号对地二极体值无异常,参考电压也正常,CPUPWOK正常,维修一时限入困境。本着从成本考虑,先更换NB,但故障依旧,遂更换SB,故障排除。但一直没有弄清楚是什么信号问题引起该板无CPURST。请大家分析提出宝贵意见。

回复 支持 反对

使用道具 举报

15#
发表于 2008-10-30 22:17:23 | 只看该作者 来自: 上海 来自 上海
需要关注的是DMI message

也就是说DMI介面所传送的信息,DMI线路的对地阻值无问题,不一定就证明DMI message传输无问题,但DMI message估计要用很高端的示波器才能抓到异常。

回复 支持 反对

使用道具 举报

16#
发表于 2008-11-1 11:31:11 | 只看该作者 来自: 江苏泰州 来自 江苏泰州
"CPURST#是由北桥发给CPU的,如北桥工作条件都正常,还找不到故障点,那就试更换北桥,这种维修思路在维修ICH7以下南桥的主板的时候是比较正确的。"

根据我的个人维修经验,CPU无RST,ICH6的南桥坏的也很多,而北桥坏的少

回复 支持 反对

使用道具 举报

17#
发表于 2008-11-1 19:45:18 | 只看该作者 来自: 广东深圳 来自 广东深圳
谢谢大家,维修此板时我还量测过角座到SB九条信号线的对地二极体值,除FERR#只有180欧左右外,其它均是350欧左右。用好板比较后确定都是正常的。所以现在更能确定飞翔老师之前说的。
    但DMI介面问题,测量其二极体阻值好像并不能判断故障点。要是飞翔老师说的用高端示波器才能抓到,那测量起来非常固难。要是有更好的办法就好了,如果大家有什么好的意见请多多发表。我也希望自己能在实际工作中找到能确定此故障的方法。

回复 支持 反对

使用道具 举报

18#
发表于 2008-11-4 04:48:20 | 只看该作者 来自: 广东深圳 来自 广东深圳
还有就是965往后的板ICH到MCH之间OPEN不会影响CPURST#相当于全FF。如果修到没CPURST#故障板PLTRST#都是正常的。按照时序修的话,都判MCH不良,但却99%是ICH不良。

回复 支持 反对

使用道具 举报

19#
发表于 2008-11-6 23:46:42 | 只看该作者 来自: 浙江杭州 来自 浙江杭州
这个文章写不错。有技术含量,研究的比较透

但INTEL板从810开始,HUBLINK有问题都会引起无CPURST的哦~~所以大家在维修INTEL芯片组的板时,无CPURST#。都一定要刮线测南北桥间的连线!

我修到过很多的疑难都是这个问题的。

回复 支持 反对

使用道具 举报

20#
发表于 2008-11-8 22:30:48 | 只看该作者 来自: 云南昆明 来自 云南昆明
的确,从INTEL 810开始,使用了HUBLINK,CPURST#的确比较特别,他是通过一个HUB INTEFACE special cycle,南桥根据寄存器值告知北桥3种具体复位模式;DMI亦然

回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表
附近
店铺
微信扫码查看附近店铺
维修
报价
扫码查看手机版报价
信号元
件查询
点位图 AI维修
助手



芯片搜索

快速回复