電腦異常藍屏問題排查記錄

2021-06-28 05:24:25 字數 2680 閱讀 6327

環境:主機板:gigabyte h87-d3h   (bios version:f5)

cpu:intel xeon e3-1230 v3 @ 3.7ghz

記憶體:4x4gb 金士頓 1600mhz cl11-11-11-28 cr:2(每2條一組是同週期生產,一組是13年32周,一組14年)

—  通道1:dimm1、dimm3(13年32周)

—  通道2、dimm2、dimm4(14年14周,也是同週期)

顯示卡:gigabyte gtx660

硬碟:plextor m5pro 128g×1(系統與常用軟體盤),wd 1t黑盤×1(軟體盤),st 250g×3 @ raid0 + raid5(大遊戲與資料盤)

前言:

我家電腦14年5月換上4x4g ddr3金士頓記憶體條,搭配的是當時使用的平台gigabyte 870a-ud3主機板 + amd 羿龍ii x4 955,win 7 sp1 32位,使用乙個月穩定。

6月中旬更換為intel平台,主機板是gigabyte h87-d3h + e3-1230v3,甚至連系統都沒有重灌,使用大半個月到7月初都很穩定。

虛擬機器裡測試發現win8.1 update體驗不錯,主要是比較煩win7的aero元件帶來的各種相容性問題,關了aero沒有視窗預覽又不好用,

所以在7月6號重灌win8.1 update 專業版 64位,悲劇從此開始。

正題:根據從aida64統計的系統日誌追朔,第1次藍屏時間為7月10日至今2023年1月14號,150多天時間共藍屏146次。最長執行時間2天3小時……好悲催的數字。

1、造成藍屏的環境不固定,玩著遊戲時、關閉瀏覽器、掛著不動低功耗執行都可能會bsod,沒有特定規律。

2、系統間歇性卡頓,整個系統全部無響應的狀態一卡就是1分鐘,硬碟讀寫燈常亮。

3、每次藍屏後開機檢測硬碟需要10秒左右,等待時硬碟讀寫燈常亮。

排查過程:

7月—11月,無頭緒大海撈針階段:

1、根據藍屏的dump檔案分析,造成藍屏的原因不固定,10次有8次崩潰時正在直行的**位址在ntoskrnl.exe+150aa0這個函式,而每次藍屏的錯誤資訊**與引數都不相同;其他2次則是各種驅動沒有規律,如顯示卡驅動,網絡卡驅動,directx驅動等等。

因此基本可以排除系統環境與驅動問題。

2、開始2個月用過好幾次memtest86+完整模式測試過3、4次記憶體,完整檢測沒有報過錯誤。

基本可以判斷記憶體顆粒無損壞。

3、懷疑過ssd(即固態硬碟)問題,但我一直將矛頭指向記憶體(其實主要是懶),未對ssd做過排查(而要排查ssd的方法沒別的,就是把系統遷移到hdd,不用ssd)

12月初,目標轉向ssd:

1、12月3號機緣巧合看到我的m5pro更新1.08韌體了,找度娘看更新內容,度娘們說修正了:系統卡頓(上面提過)和乙個導致藍屏宕機的問題。那必須是立馬更新韌體。並且向好**們廣播了一遍我家電腦的悲慘遭遇順便詛咒了一下浦科特。以為好日子來了。

2、好景不長,卡頓是沒有了,bsod還是跟稿潮一樣來個不停。這時候我又罵了一次浦科特,你丫坑我!

3、這次下定了決心排查ssd的問題。把wd 1t的hdd騰出空間劃分乙個分割槽,把ssd的系統ghost了進去,更新系統啟動項之後引導hdd的系統,藉此排除ssd的問題。

4、oh ****!還是藍屏腫麼破!這次來個徹底的,把ssd的引導分割槽和軟體分割槽全部移到1t的hdd上,直接拔掉ssd的硬碟線跟他3166,我就不信這個邪!

5、t_t我內流滿面,藍屏依然很愛我.....  這時候已經是12月底了

so,可以確定藍屏不是ssd造成的。

轉眼到了15年1月初:

戰鬥未結束,同志需努力……浪子回頭盯回記憶體了,畢竟按nnnn多經驗講這基本只會是記憶體的問題。首先要列出記憶體情況,制定記憶體排查方案。一開始說到我電腦是4根4g記憶體,其中2個(dimm1、3)是13年32周,另外2個(dimm2、4)是14年也是同一周,一開始就已經考慮到這個情況,把同週期記憶體插到同一通道裡,減少雙通道128bit的相容問題。

1號,拔掉dimm4槽記憶體,3天後依然藍屏(1月1-3號)

4號,再拔掉dimm2槽記憶體,剩下通道1連續執行6天沒有藍屏。(看到6天這數字我好感動t-t)根據之前150天藍屏146天的頻率,外加以前的最長執行時間是2天來講,這個基本可以確定是穩定了(1月4號-9號)

10號,把已經拔出來的原來dimm4槽的記憶體插到dimm2槽,藍屏(1月11號-13號)

14號,拔出插到dimm2的記憶體,把記憶體插回dimm4,(現在插槽是3根記憶體,dimm1+dimm3+dimm4)結果memtest86+都跑不過了,瞬間報錯。這個可以理解。(14號測試over)

14號,把dimm1和dimm3拔掉,插上dimm2和dimm4測試,6天穩定(20號測試over)

20號,重新將4根記憶體插回去(dimm1+dimm3一組)全部插上,沒有修改任何bios設定,系統執行剛過3天藍屏……(23號測試over)

—  通道1:dimm1、dimm3(14年14周)

—  通道2、dimm2、dimm4(13年32周)

23號,修改主機板bios設定,關閉rank lite***,將記憶體電壓調整至1.6v,保持1600mhz頻率,2天藍屏4次……(25號over)

25號,修改主機板bios設定,同時關閉rank inte*** 和 channel inte***,將記憶體電壓調整回1.5v,但將頻率降至1333mhz 

電腦藍屏問題排查

電腦藍屏故障的檢修方法 當電腦發生藍屏故障時,按照如下的檢修方法進行檢修。1 首先了解發生藍屏前電腦的情況及所做的操作。如果電腦在cpu或記憶體等超頻後,出現藍屏,則藍屏故障與超頻有關,只要將頻率恢復正常即可。2 如果電腦在光碟機讀盤時被非正常開啟導致藍屏,則藍屏故障是由於被誤操作引起的,此故障一般...

windows監控 排查藍屏問題

dump包分析 工具bluescreenview.exe,看下藍屏 程序分析工具 procexp.exe procexp64.exe 分析占用cpu or 記憶體最大的 程序,雙擊檢視其執行緒,啟用的服務有哪些。系統日誌 計算機 管理 事件檢視器 系統日誌 windows日誌 系統 或者其他日誌 檢...

記憶體引起的藍屏問題排查

一台膝上型電腦增加了相同型號的4g記憶體,共8g記憶體,初使用一切正常。有一次在一天內出現了三次藍屏,大約間隔20分鐘就出現了一次。因為考慮新增了記憶體,所以先從記憶體排查起,找開記憶體蓋板後,型號相同,品牌相同,拆記憶體時發現有一塊溫度相對要明顯高一些,於是先留下溫度低的那塊進行測試。使用memt...