Массив RAID6 на 6 дисках стал недоступен
Задача | Восстановить данные с RAID6 на 6 дисках. | ||||||||
Оборудование |
|
||||||||
Проблема заказчика | Завис сервер, перезагрузили. Система на SSD загрузилась, а логический диск D на рейд 6 стал недоступен. | ||||||||
Результаты диагностики | В ходе диагностики установлено, что все диски определяются корректно, выборочное сканирование нечитаемых секторов не выявило. Диски рассинхронизированы, а это значит, что есть неактуальные диск или диски. | ||||||||
Процесс |
Для восстановления данных и получения доступа к файлам и папкам нам необходимо определить несколько параметров для сборки рейд массива:
Задачу определения этих параметров упрощает тот факт, что на массиве использовалась файловая система NTFS. Так как в файловой записи содержится ее порядковый номер в главной таблице файлов, то по этим записям можно определить, как минимум размер страйпа. Для этого с помощью дискового редактора находим достаточно длинную последовательность файловых записей на одном из дисков и проверяем на остальных дисках в этом же месте файловые записи. Если есть, то по минимальной разнице между номерами файловых записей определяем размер блока страйпа. В нашем случае это 512 секторов или 256кб. Для определения порядка дисков проще всего найти начало нового цикла чтения дисков в зоне, где есть файловые записи. Для этого берется номер любого сектора из последовательности с файловыми записями и в калькуляторе это значение делим на количество дисков в массиве и размер блока страйпа в секторах. Округляем полученное значение до целого и умножаем в обратном порядке. И переходим на этот номер сектора на всех дисках. Затем по номерам файловых записей выстраиваем диски по возрастанию и получаем последовательность дисков. Затем для удобства в экселе строится таблица с номерами дисков и соответствующими номерами файловых записей и определяем алгоритм распределения контрольных сумм и порядок чтения дисков. Рейд массив мы собирали в программе UFSExplorer. Сделав проверку состояния файловой системы, мы обнаружили ошибки. То есть в рейд массиве есть неактуальный диск или диски, так как RAID6 допускает потерю до двух дисков из состава массива. Далее мы последовательно начали исключать диски по одному и проводить проверку. И только на 4 диске настигла удача. То есть, исключив четвертый диск в сборке рейд массива, в ходе проверки не обнаружилось ошибок. Для уточнения были найдены последние по дате создания и изменения большие файлы. Эти файлы открывались без ошибок. Далее оставалось только сохранить данные на отдельный диск. |
||||||||
Результат | В результате мы сохранили более 6 Тб данных. Показали удаленно их заказчику и полученный результат его устроил. Работы приняты и оплачены. |