Пара баллов:
Вы ДОЛЖНЫ ДОЛЖНЫ ДОЛЖНЫ создать резервную копию тома Amazon EBS.
Они заявляют о «лучшей» надежности, но не о 100%, и это НЕСКОЛЬКО порядков от долговечности S3 «12 9». Долговечность S3 >> Долговечность EBS. Это факт. EBS поддерживает функцию «моментальных снимков», которая позволяет эффективно и постепенно выполнять резервное копирование на S3. Кроме того, со снимками EBS вы платите только за сжатые дельты, которые обычно намного меньше, чем размер выделенного тома. В другой жизни я отправлял электронные письма о потерянных объемах таким маленьким клиентам, как вы, которые «думали», что EBS «долговечен», и доверяли ему единственную копию критически важной базы данных ... это душераздирающе.
Ваш вопрос: автоматизация запуска нового экземпляра
Упомянутый вами путь проектирования относительно не прослеживается; вот почему ... Многие компании используют избыточные «горячие» экземпляры, где второй экземпляр загружается и работает. Это позволяет осуществлять быстрое аварийное переключение (в секундах) в случае «сбоя» (может быть аппаратным или программным). Проблема с «холодным запасом» состоит в том, что сложнее поддерживать машину в актуальном состоянии и быть готовой забрать там, где остановилась старая коробка. Что еще более важно, СЛЕДУЕТ проверять, что запасные части способны успешно восстановить вашу производственную службу. Аппаратное обеспечение более надежно, чем непроверенные программные системы. ТЕСТ ТЕСТ ТЕСТ. Если вы не проверили свое переключение при сбое, оно не работает.
Простая автоматизация запуска нового экземпляра EBS проста, граничит с тривиальным. Это всего лишь однострочный bash-скрипт, вызывающий инструменты командной строки EC2 . Хитрость в том, что все это сверху. Такое решение в значительной степени предполагает полностью автоматизированный процесс развертывания. И это все специфично для вашего приложения. Может ли ваше приложение получить все данные, необходимые для запуска (может быть, оно хранится в S3?). Можете ли вы убить свой экземпляр сегодня и загрузить новый экземпляр с 0,000 шагов ручной настройки / установки?
Или, возможно, вы говорите о сценарии, который я назову «повторное создание тома EBS» :
- Умирает коробка EC2 (корневой том EBS)
- Принудительное отключение EBS громкости
- Загрузка нового экземпляра EC2 с томом EBS
... То, что в основном работает. Полученные ошибки:
- Не защищает от сбоев EBS, как полной потери тома, так и потери доступности
- Время восстановления равно O (минутам), при условии, что все работает правильно
- Ваши службы должны быть настроены для автоматического перезапуска. Не стоит возвращать коробку, если Nginx не работает.
- Ваши DNS-маршруты или другие сервисы или что-то еще должно быть в порядке с изменением IP-адреса. Это можно обойти с помощью ElasticIP.
- Как обрабатываются SSH-ключи вашего хоста? То же имя, новый ключ хоста может нарушить автоматизацию на основе SSH, когда он получает строгое предупреждение об изменении ключа хоста.
- У меня нет доказательств этого (кроме случая, чтобы это произошло один раз), но я считаю, что EC2 / EBS _already_does_this_ автоматически для экземпляров загрузки из EBS
Опять же, самая сложная часть на вашей тарелке. Можете ли вы остановить свою производственную службу сегодня и НАДЕЖНО запустить ее на новом экземпляре? Если так, то часть истории EC2 действительно очень проста .