![]() |
||
Power Member
![]() ![]() 加入日期: Jun 2004
文章: 637
|
[求救]MSM unrecoverable medium error during recovery
求教高手
我們的陣列卡用的是LSI MegaRAID SAS 9260-8i,硬碟WD 4TB 企業版4顆。 發現問題是因為同事說最近幾天伺服器不穩,COPY檔案很容易當機。因此搬回來檢查後發現很可能是某一顆硬碟有嚴重壞軌所導致 (此時的RAID還在進行consistency check process)。 在告知同事需要好幾個小時,等RAID檢查修護後才能正常,同事表示這樣無法工作,是否能直接更換硬碟把有壞軌的硬碟直接換掉。但不幸的是在搬回開機後才發現某顆硬碟的排線有鬆動,RAID 已經出現degraded... 心中想的是先等rebuild完成後再來更換硬碟處理壞軌問題。 無奈的是鬆脫的那顆硬碟不是有壞軌的那顆,因此此時的rebuild已經無法順利運行 (1小時跑不到1%),log的[Information]變為[Fatal],訊息改成了unrecoverable medium error during recovery。 請問我現在還能怎麼做? 還是只能用HBA卡看能救多少算多少嗎? ============================================== 補充 : 現在裡面的資料已經無法COPY出來,COPY沒多少就會當機自動重開了 此文章於 2019-12-30 12:41 PM 被 eddie1 編輯. |
|||||||
![]() |
![]() |
Golden Member
![]() ![]() ![]() ![]() 加入日期: Aug 2004
文章: 2,892
|
好像可以應把動到排線那顆revive
__________________
![]() |
||
![]() |
![]() |
Power Member
![]() ![]() 加入日期: Jun 2004
文章: 637
|
引用:
抱歉,指的是make online嗎? 當時由於是開機狀態,怕make online之後被判為非同步而整個掛掉,所以當時並未採用此法,而是選擇了rebuild. |
|
![]() |
![]() |
Golden Member
![]() ![]() ![]() ![]() 加入日期: Aug 2004
文章: 2,892
|
引用:
應該是 那棵被mark offline了,確定是好的就make online
__________________
![]() |
|
![]() |
![]() |
Power Member
![]() ![]() 加入日期: Jun 2004
文章: 637
|
引用:
謝謝 很久以前曾遇過類似情況,在開機並已進入系統後硬碟突然offline (後來發現是Digital Server背板接觸問題),當時make online後反而整個raid掛點,之後原廠工程師說在開機狀態下的硬碟offline,如果直接make online,是會有硬碟內資料不同步而導致損失整個陣列的可能性。 所以在那之後碰到類似問題,我就沒有再使用make online還原過了。 只是這次碰到了重建+壞軌... 唉 |
|
![]() |
![]() |
Junior Member
![]() ![]() ![]() 加入日期: Jan 2002
文章: 865
|
引用:
只有四顆硬碟,如果資料很重要的話,先拿四顆硬碟出來把這四顆 ddrescue 一下,然後拿複製出來的硬碟去拯救資料.. |
|
![]() |
![]() |