域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過
EMC存儲(chǔ)服務(wù)器VNX5000 5100,VNX5300/5400/5500/5600/5700/5800 陣列崩潰raid兩塊盤及兩塊盤以上離掉線數(shù)據(jù)恢復(fù)的思路整理及方法
【前期故障表現(xiàn)】
泉州某生產(chǎn)型企業(yè), EMC VNX 5100存儲(chǔ)中,RAID5陣列故障導(dǎo)致存儲(chǔ)癱瘓,10塊硬盤有3塊硬盤離線,其中前4塊硬盤是EMC系統(tǒng),系統(tǒng)區(qū)域正常,前期有兩塊盤先掉線,4號(hào)盤熱備盤頂上后,8號(hào)盤又損壞掉線,EMC控制平臺(tái)里面顯示,disk5,disk6,disk8狀態(tài)為removed ,同時(shí)顯示硬盤亮黃燈,陣列損壞,LUN顯示每個(gè)分區(qū)為FAUlTED,里面保存著重要的財(cái)務(wù)SQL2005 數(shù)據(jù)庫(kù)丟失。
UPS電源AB組模塊也報(bào)警,亮黃燈,IBM服務(wù)器應(yīng)用無法加載此EMC存儲(chǔ)上的數(shù)據(jù)庫(kù),所以數(shù)據(jù)無法訪問,客戶經(jīng)廈門某著名IT培訓(xùn)中心的寧老師,聯(lián)系上了北京技佳瑞康科技有限公司廈門分公司的羅工上門恢復(fù)
1、->EMC存儲(chǔ)數(shù)據(jù)恢復(fù)過程
此臺(tái)EMC VNX5100硬盤 600G 10K 005049249此款硬盤也通常應(yīng)用在VNX5200 5300 5400 5500等存儲(chǔ)上,
EMC VNX系列存儲(chǔ)使用的是520字節(jié)長(zhǎng)度的硬盤,常規(guī)陣列卡及備份軟件WINHEX無法備份,只有在PC3000 SAS上可以操作,之前其它是把520字節(jié)轉(zhuǎn)換成512格式后鏡像,然后這個(gè)鏡相對(duì)組合RAID陣列,然后,EMC智能存儲(chǔ)的RAID結(jié)構(gòu)非常特殊,和普通RAID5完全不同。一般的文件系統(tǒng)和軟件是無法解析的,手工分析文件及陣列也不現(xiàn)實(shí),目前軟件針對(duì)EMC還沒有一個(gè)完美的解決方案。
2、->陣列Raid5成員硬盤檢測(cè)過程
先對(duì)每一個(gè)硬盤做好物理順序編號(hào),由于硬盤離線亮黃燈,硬盤工程師首先對(duì)raid陣列中的亮黃燈的明顯硬盤硬盤先進(jìn)行檢測(cè),發(fā)現(xiàn)6號(hào)壞道大量壞道,5號(hào)盤壞道不是很多,8盤盤壞掉20個(gè)以下,后面對(duì)其它成員硬盤進(jìn)行物理檢測(cè)(包括掉線盤和正常磁盤)除4號(hào)熱備盤和7號(hào)去年剛替換的盤全好外,所有磁盤或多或少都有物理故障
3、->raid陣列成員盤數(shù)據(jù)備份】
由于硬盤或多或少都有問題,為了對(duì)數(shù)據(jù)進(jìn)行保護(hù),做到只讀不寫,羅工決定按照數(shù)據(jù)恢復(fù)流程開始對(duì)所有成員磁盤進(jìn)行備份,源磁盤的扇區(qū)大小為520字節(jié),因此還需要使用特殊工具PC3000 SAS或是我們公司自己研發(fā)的軟件進(jìn)行鏡相備份,520-520鏡相
4、->【根據(jù)壞的盤順序重構(gòu)RAID組結(jié)構(gòu)】
一般存儲(chǔ)或陣列是對(duì)盤進(jìn)行鏡像完成后將在鏡像文件底層raid信息進(jìn)行分析,得出raid的數(shù)據(jù)塊大小和條帶分布規(guī)律,陣列結(jié)構(gòu)后重組原raid組,此磁盤陣列中8號(hào)盤最先掉線,好盤鏡相后上線,不再報(bào)錯(cuò),5號(hào)盤倒數(shù)第二次掉線,但由于6號(hào)盤早已掉線,4號(hào)熱備頂上,只能先重建6號(hào)盤,再騰出4號(hào)熱盤后,再重新5號(hào)盤。6和5中都是前半年前的數(shù)據(jù),只能用空白盤去同步,只到接上6號(hào)故障盤后,數(shù)據(jù)開始同步,4號(hào)熱備盤Equalizing均衡還原6號(hào)盤,
再Rebuilding4號(hào),熱備盤頂上5號(hào)盤,
接上5號(hào)好盤,再Equalizing均衡還原5號(hào)。
Rebuilding過程中LUN的狀態(tài)
5、->【Lun信息故障還原】
ZFS文件系統(tǒng)比較復(fù)雜,目前對(duì)EMC的ZFS還沒有完整的解決方法,只能在設(shè)備上完成恢復(fù)
LUN恢復(fù)成功后,狀態(tài)由FAULTED變?yōu)镽EADY
6->數(shù)據(jù)恢復(fù)結(jié)果驗(yàn)證
北京技佳瑞康科技有限公司廈門分公司的羅工和客戶方一起努力,歷時(shí)4天,數(shù)據(jù)100%恢復(fù)成功,客戶方工程師對(duì)所有數(shù)據(jù)和SQL2005數(shù)據(jù)庫(kù)進(jìn)行現(xiàn)場(chǎng)驗(yàn)證,數(shù)據(jù)恢復(fù)完美驗(yàn)證。
總結(jié):EMC的存儲(chǔ)雖然穩(wěn)定,但也是要經(jīng)常機(jī)房巡檢,數(shù)據(jù)還是要有備份,有備無患!很多時(shí)候物理層恢復(fù)了,但是存儲(chǔ)的狀態(tài)還是不行或是硬盤狀態(tài)不對(duì),類似于我去年恢復(fù)的VNX5400上面掛載了幾臺(tái)磁盤柜,就需要廠家二線工程師,甚至是廠家三線工程師的技術(shù)支持恢復(fù)完成。
北京技佳瑞康科技發(fā)展有限公司成立長(zhǎng)2012年,國(guó)家保密局涉密數(shù)據(jù)恢復(fù)資質(zhì)單位,總部位于北京,在上海、深圳、廈門、南京等地設(shè)有分公司,聯(lián)想集團(tuán)數(shù)據(jù)恢復(fù)供應(yīng)商, 2017-2019北京市政務(wù)信息安全應(yīng)急保障單位,北京市誠(chéng)信創(chuàng)建企業(yè),中國(guó)石油IBM 渣打銀行數(shù)據(jù)恢復(fù)服務(wù)商!
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!