Восстановление RAID5 на 4 SCSI-дисках

Задача

Восстановить данные с рейд RAID5 на 4 SCSI-дисках.

Оборудование

HDD	4 x ST314670707LC
Интерфейс дисков	SCSI
Файловая система	NTFS
Сервер	Dell 2850
Режим работ	Экстренный

Проблема заказчика

Пропал доступ к данным. Контроллер показывает, что два диска FAIL

Результаты диагностики

Два диска полностью рабочие: сканирование поверхности на наличие нечитаемых секторов таковых не выявило.

Из неисправных дисков: у одного клин двигателя, и для снятия образа требуется пересадка магнитных дисков в другой диск на исправный мотор; у другого — проблема в служебной зоне, поврежден модуль транслятора, диск определяется, но доступа к поверхности нет, сектора не читаются.

Процесс

Технология объединения дисков в RAID-5 подразумевает (за счет своей избыточности) продолжение непрерывной работы и сохранности данных при выходе из строя одного диска. В нашем же случае из четырех дисков неисправны два. Причем, по заявлению заказчика, в какой последовательности диски выходили из строя, ему неизвестно.

Получается, что для получения доступа к данным после сборки рейд-массива программными средствами, эмулирующими работу контроллера, необходимо реанимировать как минимум один диск из двух неисправных. И если первый неисправный диск окажется неактуальным, то придется восстанавливать другой неисправный диск.

Естественно, было принято решение начать с диска с менее серьезной поломкой — диска с битым транслятором.

С помощью программного комплекса собственной разработки перед пересчетом транслятора для восстановления работоспособности диска необходимо сохранить модули служебной информации и только потом запускать пересчет транслятора. Надо отметить, что для SCSI дисков фирмы Seagate это достаточно распространенная проблема.

После того как диск удалось восстановить, был сделан образ, в процессе создания которого при чтении сбойных секторов (бэд-блоков) не обнаружилось.

Теперь можно попробовать собрать рейд-массив. Анализ дисков показал, что в конце дисков в метаданных есть информация о порядке дисков в рейд-массиве. Это упростило определение, какого диска не хватает в массиве. Оказалось, что нет первого диска.

Нашли файловые записи NTFS и по их номерам установили размер блока и алгоритм чтения диска. Это 128 секторов и алгоритм Backward Dynamic.

Собрав рейд-массив в ПО R-Studio и отсортировав данные по дате изменения, провели проверку «свежих» файлов на целостность.

В результате: файлы открываются, а это значит, что диск с битым транслятором оказался последним из вышедших из строя. Хотя, надо признаться, точно этого утверждать нельзя. Ведь для этого надо получить образ диска с клином. Но для восстановления данных с рейд-массива RAID-5 в экстренном режиме, когда важно время получения данных, в реанимации клинового диска нет необходимости.

Результат

Данные в виде файлов и папок были восстановлены. Но заказчик настоятельно попросил реанимировать работу всего рейд-массива, то есть собрать рейд на новых дисках на его оборудовании и на него «накатить» полученный при восстановлении образ рейд-массива. Это уже получается восстановление данных и работоспособности сервера под ключ.

Ваш город - Москва?

Восстановление RAID5 на 4 SCSI-дисках