Восстановление RAID 5 NAS Kraftway SSR212MC2 – 11 дисков Seagate Constellation ES ST31000524NS
- Задача: Восстановление RAID 5 после неправильного ребилда и перезаписи данных
- Уровень RAID массива: RAID 5
- Тип хранилища: NAS Kraftway SSR212MC2
- Объем массива: 9 Терабайт
- Диски: 11 * Seagate Constellation ES ST31000524NS 7200rpm 32Mb
- Город: Надым
- Файловая система: NTFS
Постановка задачи клиентом
Почти дословная копия Технического Задания:
NAS Kraftway SSR212MC2. RAID 5 из 11 дисков (1 диск Global Hot Spare). На приложенном CD-лог массива и информация о конфигурации. Дисковый массив перестал быть виден в сети. При вскрытии серверной выяснилось, что произошел отказ системы кондиционирования, температура в помещении зашкалила. Дисковый массив оставался во включенном состоянии, слышался писк системы предупреждения, корзины дисков HDD 5, HDD14 инициировали сбой диска.
Прибывший специалист службы АСУ выключил NAS. После его остывания включил, после загрузки индикация на корзинах дисков не изменилась. На горячую был вынут и снова установлен HDD 5(«передернут»). Однако диск системой не был распознан. Через утилиту управления RAID-массивом было установлено, что диск система видит, но его не использует. Диск был проинициализирован. Индикация неисправности исчезла, диск был воспринят, как часть RAID-массива. HDD 14 был сразу проинициализирован — в системе, индикация неисправности исчезла. Роль Hot Spare диску не назначалась, в RAID-массив диск включен не был.
Была проведена проверки целостности данных. Установлено, что данные целы, доступны пользователям. Через какое-то время было принято решение заменить сбойные диски. Сначала был заменен HDD 5 на новый диск HDD 13. Произошел ребилд массива. Через некоторое время пользователи обнаружили, что весь контент массива «битый» (выпадение информации из файлов), при этом файлы доступны для чтения.
Был заменен неисправный HDD 14 на новый диск HDD 8. Проинициализирован системой, помечен как Global Hot Spare. Ситуация с контентом не изменилась. Предполагая возможность восстановления информации с замененного HDD 5 решили вернуть сбойный диск на место. Замена осуществлялась на выключенном устройстве. После включения массива HDD 5 был опознан как неисправный, произошло перестроение массива на Spare. Ситуация с контентом не изменилась. Пока решали, что предпринять для восстановления утраченной информации, на данный массив был записан бэкап медиаконтента эфирного сервера, примерно 2 Tb.
Диагностика RAID массива
С массивом сделали всё что только можно и по первоначальному описанию кажется, что данные восстановить будет нельзя — ребилд, еще ребилд, перезапись данных. В реальности видим следующую картину:
- на всех дисках уничтожены контрольные суммы;
- на двух дисках есть бэд блоки;
- есть несколько почти одинаковых копий одного из дисков;
- есть следы работы чек-диска;
- данные восстановить МОЖНО.
Восстановление
Определяем оптимальную сборку, вычитываем диски с бэд блоками, восстанавливаем контрольные суммы, копируем данные. Общее время выполнения — порядка 3-х суток.
Заключение
Повезло несколько раз:
- бОльшая часть повреждений пришлась на контрольные суммы, которые удалось пересчитать;
- все неправильные ребилды затронули восстановимую часть массива;
- новые данные писались на массив с учетом расположения старых данных ($Bitmap — карта занятого пространства – почти полностью сохранился).
Произведено полное восстановление RAID 5, заказчик полностью удовлетворён результатами, сроками и качеством работы.
Если с вашим оборудованием происходят похожие проблемы и вам требуется восстановление данных, звоните по круглосуточным телефонам 8 (495) 280-18-99, 8 (812) 449-48-22 чтобы проконсультироваться с нашими специалистами.