Восстановление RAID5 на 4 SCSI-дисках
Задача | Восстановить данные с рейд RAID5 на 4 SCSI-дисках. | ||||||||||
Оборудование |
|
||||||||||
Проблема заказчика | Пропал доступ к данным. Контроллер показывает, что два диска FAIL | ||||||||||
Результаты диагностики | Два диска полностью рабочие: сканирование поверхности на наличие нечитаемых секторов таковых не выявило.
Из неисправных дисков: у одного клин двигателя, и для снятия образа требуется пересадка магнитных дисков в другой диск на исправный мотор; у другого — проблема в служебной зоне, поврежден модуль транслятора, диск определяется, но доступа к поверхности нет, сектора не читаются. |
||||||||||
Процесс |
Технология объединения дисков в RAID-5 подразумевает (за счет своей избыточности) продолжение непрерывной работы и сохранности данных при выходе из строя одного диска. В нашем же случае из четырех дисков неисправны два. Причем, по заявлению заказчика, в какой последовательности диски выходили из строя, ему неизвестно. Получается, что для получения доступа к данным после сборки рейд-массива программными средствами, эмулирующими работу контроллера, необходимо реанимировать как минимум один диск из двух неисправных. И если первый неисправный диск окажется неактуальным, то придется восстанавливать другой неисправный диск. Естественно, было принято решение начать с диска с менее серьезной поломкой — диска с битым транслятором. С помощью программного комплекса собственной разработки перед пересчетом транслятора для восстановления работоспособности диска необходимо сохранить модули служебной информации и только потом запускать пересчет транслятора. Надо отметить, что для SCSI дисков фирмы Seagate это достаточно распространенная проблема. После того как диск удалось восстановить, был сделан образ, в процессе создания которого при чтении сбойных секторов (бэд-блоков) не обнаружилось. Теперь можно попробовать собрать рейд-массив. Анализ дисков показал, что в конце дисков в метаданных есть информация о порядке дисков в рейд-массиве. Это упростило определение, какого диска не хватает в массиве. Оказалось, что нет первого диска. Нашли файловые записи NTFS и по их номерам установили размер блока и алгоритм чтения диска. Это 128 секторов и алгоритм Backward Dynamic. Собрав рейд-массив в ПО R-Studio и отсортировав данные по дате изменения, провели проверку «свежих» файлов на целостность. В результате: файлы открываются, а это значит, что диск с битым транслятором оказался последним из вышедших из строя. Хотя, надо признаться, точно этого утверждать нельзя. Ведь для этого надо получить образ диска с клином. Но для восстановления данных с рейд-массива RAID-5 в экстренном режиме, когда важно время получения данных, в реанимации клинового диска нет необходимости. |
||||||||||
Результат | Данные в виде файлов и папок были восстановлены. Но заказчик настоятельно попросил реанимировать работу всего рейд-массива, то есть собрать рейд на новых дисках на его оборудовании и на него «накатить» полученный при восстановлении образ рейд-массива. Это уже получается восстановление данных и работоспособности сервера под ключ. |