Каждый хочет 100% безотказной работы, но добиться этого практически невозможно.Так как время простоя может быть вызвано любым звеном в цепочке, а их, как правило, десятки, для достижения такого высокого стандарта вам нужно будет купить все позолоченное.По сути, вам придется потратить целое состояние.Разница между временем безотказной работы 99%, что означает, что ваш сайт недоступен в течение примерно 88 часов в год, и продолжительностью безотказной работы 99,9%, когда она составляет менее десяти часов, значительна, а оттуда до 99,99% еще выше, когда допуск нижечас в течение всего года.
Выход за пределы 99,99% просто нецелесообразен.Никто не подпишет подобную гарантию, если только они не будут нечестными, соглашение будет настолько загружено предостережениями, что его невозможно будет выполнить, или не будут возражать против выдачи крупных кредитов все время.Соглашение об уровне обслуживания Amazon EC2 составляет, например, 99,99%.
Метрики, которые я видел, собранные на провайдере, таком как Linode, показывают время безотказной работы от 99,97% до 99,99%.Иногда вы видите центры обработки данных со 100% безотказной работой, но это только сетевой уровень и не учитывает периодические внутренние сбои, которые могут сбить ваш сервер в автономном режиме.
Выбор провайдера управляемого хостинга, такого как Engine Yard, может бытьрешение для вас, потому что оно может свести к минимуму ваше воздействие случайных событий, но само по себе оно не обеспечит вам такого большого времени безотказной работы.Они очень хорошо поддерживают системный уровень, но их способность исправлять или обходить ошибки в вашем приложении очень ограничена, и они подвержены тем же периодическим проблемам с сетью в EC2, что и все остальные.
Есть два вида надежности, с которыми вы должны быть обеспокоены.Одним из них является доступность, которая является просто мерой того, насколько вероятно, что клиент сможет использовать приложение.Другой - это целостность данных, которая является мерой вероятности сохранения данных при любом количестве сценариев стихийных бедствий.
Большинство людей признают, что приложение может время от времени не работать в течение коротких периодов времени,но люди отказываются признавать, что данные могут время от времени пропадать.
Нетрудно получить коэффициент хранения данных «99,99999999999%», но вам нужно будет спланировать резервное копирование, репликацию истратегии восстановления в деталях, и вам придется регулярно проверять работу ваших систем, чтобы убедиться, что они работают так, как задумано.
В тех случаях, когда вы почти не контролируете часто нестабильную маршрутизацию в Интернете, уровень дефектов в оборудованииваш сервер, питание в вашем центре обработки данных и т. д., у вас есть огромный контроль над стратегией резервного копирования.