【事件】因磁碟陣列問題而導致資料遺失

星期一 228,大家幾乎都在放假的時候,我們公司卻需要上班,想當然而也不會有什麼客戶或電話上門。

聽說今天有一位大師要來公司看風水,想用DV攝影記錄下來,就到了機房去拿DV準備,一進機房聽到了很大聲響的雜音,明顯的又是Server的風扇掛了,只好停掉Server查出哪幾顆風扇壞掉,再到電子材料行去買風扇回來換,話說這類的風扇可真是貴,光一顆就價120元!

將風扇更換完之後為了測試是否正常,將電腦開機,但就在開機前我想到為了不讓硬碟轉了又停,所以將硬碟全部拔出(因為是機架式伺服器很快速),但問題就從此開始了,開機之後發現無法進入到系統,我想可能是拔出硬碟又開機的原因,Raid裝置找不到硬碟,又裝上去的話應該要重建的樣子。但當時我對Raid完全不了解,系統內選項看不出個所以然來,就這樣試來試去一個不小心把磁碟陣列資訊全部清除,已經確定開不了機,趕快上網查詢相關資料。

似乎必須重建磁碟陣列資料才行,但必須跟之前的一模一樣,我重建了許多次還是不行,後來只好宣告整個Server的硬碟資料全部遺失...此時真是晴天霹靂!沒有什麼事情比這更恐怖了,之前因為知道有Raid所以就沒做備份,沒想到Raid一出問題就全掛了...

P.S 其實正確的作法:在這邊我不應該自行重建Raid的資訊,因為我記得Server是做Raid 1,可以先把兩顆硬碟拔出到別台電腦上進行資料備份在重建Raid即可。

但在這邊,我並沒有其他電腦可以讀scsi的硬碟,其他電腦也都是Server但規格都不太一樣,有一台雖然也是scsi的硬碟,但也有做Raid並不清楚是否可以直接把原本硬碟拔出再插入另外的硬碟讀取,所以我不敢貿然實行...

然而原來Server的一部分功能只好由另一台Server暫代。首先的想法是將Raid重建然後重裝系統,再裝檔案救援軟體,雖然有掃到某部分的遺失檔案內容,但還原之後卻無法開啟,幾乎都已經損壞無法使用,嘗試了不同的軟體結果都一樣,看來只能死心...接下來就專注於還原Server該有的系統功能。

決定要做哪種Raid時,也上網查了各種Raid的功效以及選擇哪種Raid比較適合,這期間我在網路上問過此次的發生問題,有網友提到我原本的系統真的是做Raid 1嗎?其實仔細想想我也不是很確定,原先對於Raid就不太懂沒去詳細看過,只依稀記得Raid Bios裡面的分配大概,或許真的不是Raid 1也說不定。那這次將Server全新重裝,經過仔細考慮安全性與效能等等,決定使用Raid 10,期間有考慮過使用Raid 5,但我還是偏向於安全性高一點的Raid(雖然硬碟容量變成50%)。

前陣子才看到有網友說到,如果有多的電腦可以用,會把那台電腦弄成可以馬上上線狀態的備援機,而我也才剛有這種想法還沒實行,沒想到就發生這樣的事情,而在這件事件也體驗到,就算有做Raid還是需要備份資料,只有不斷的備份資料才能保全(當然備份資料的地點也要考慮),Raid我想最大的功用點在硬碟,如只有一顆硬碟壞掉還可以馬上換新的繼續不受影響的使用,但其他就沒辦法了。

此事件經歷過了4天左右才完全好,但遺失的資料已經無法復原,幸好另一台舊電腦內還有當時移轉過去的原始資料,遺失資料的時間大概8個月左右,但要重建資料也得花費很長的時間了~

留言

這個網誌中的熱門文章

World Gym 解約退會過程

泰有趣的一天-大里【泰鑽】泰式料理