Недавно я прочитал статью под названием «Надежность SATA и SCSI» . В основном обсуждается очень высокая скорость переброса битов в пользовательских дисках SATA и делается вывод «56% вероятности того, что вы не сможете сейчас прочитать все данные с определенного диска». Даже Raid-5 не может спасти нас, так как он должен постоянно сканироваться на наличие проблем, и если диск умирает, у вас наверняка есть несколько битов в восстановленной файловой системе.
Вопросы:
Я слышал замечательные вещи о ZFS от Sun с Raid-Z , но реализации Linux и BSD все еще являются экспериментальными. Я не уверен, что он готов к прайм-тайм.
Я также немного прочитал о формате файла Par2 . Похоже, что сохранение некоторого дополнительного% четности вместе с каждым файлом позволит вам избавиться от большинства проблем. Однако мне неизвестна файловая система, которая делает это внутренне, и кажется, что управлять отдельными файлами может быть сложно.
Резервные копии (Изменить):
Я понимаю, что резервные копии имеют первостепенное значение. Однако без какой-либо проверки вы могли бы легко отправлять плохие данные людям, даже не подозревая об этом. Также может быть сложно определить, какая резервная копия содержит хорошую копию этих данных.
Например, у вас есть массив Raid-5, работающий в течение года, и вы нашли поврежденный файл. Теперь вы должны вернуться к проверке резервных копий, пока не найдете хорошую копию. В идеале вы должны перейти к первой резервной копии, которая содержит файл, но это может быть трудно понять, особенно если файл редактировался много раз. Хуже того, подумайте, был ли этот файл добавлен или отредактирован после повреждения. Одной этой причины достаточно для четности на уровне блоков, такой как Par2.