Как я могу автоматически перезагрузить экземпляр GCE после его сбоя? - PullRequest
0 голосов
/ 08 февраля 2020

Мне кажется, я хочу, чтобы сценарий оболочки автоматически перезагружал экземпляр, независимо от того, происходит ли сбой из-за проблем программного или аппаратного обеспечения.

Операционная система - Ubuntu 18.04.

Ответы [ 2 ]

1 голос
/ 08 февраля 2020

Вероятно, будет несколько решений. Один из них, который вы могли бы рассмотреть, - это использовать проверку работоспособности Google Stackdriver Monitoring. Это позволяет вам определить измерение сервисного / вычислительного движка, находящегося в состоянии «вверх» ... см .:

https://cloud.google.com/monitoring/uptime-checks

Если вычислительный движок не отвечает (потому что он потерпел крах или иным образом недоступен), это может вызвать предупреждение, которое может вызвать канал уведомлений, который может вызвать webhook, который может использовать API управления Compute Engine для остановки или перезапуска Compute Engine.

Break Ваша головоломка разбита на отдельные части:

  1. Как определить, что Compute Engine не отвечает или зависает?
  2. Как вызвать какое-либо программное обеспечение / службу / задачу / функцию, которая будет выполнять пользовательскую логи c?
  3. Как мне выполнить логи c, которые будут останавливать / перезапускать вычислительный движок?

Если вы соедините эти части вместе, вы должны иметь ваше решение.

0 голосов
/ 10 февраля 2020

GCE предоставляет управляемым группам экземпляров функцию автоматического исцеления, которая может быть полезна для рабочих нагрузок без сохранения состояния и состояния.

В случае рабочей нагрузки с состоянием, если вы ожидали, что ваша нагрузка с состоянием может достигнуть sh, вы должны принять превентивные меры для защиты целостности данных, такие как регулярная фиксация, хранение журналов транзакций в быстром надежном хранилище, оптимизированное для записи с помощью Кэш с обратной записью отключен, снимки, initdbscript и т. д. c, очень похожи на те, что вы делали на голых системах.

Далее вам понадобятся отличительные проверки здоровья (в соответствии с рекомендациями Kolban ). У вас должны быть отдельные проверки работоспособности для балансировки нагрузки и автоматического заживления.

Наконец, создайте MIG с проверками здоровья и автоматическим лечением в соответствии с вашими потребностями.

См.

Группы экземпляров: автоматическое лечение

Настройка проверки работоспособности и автоматического лечения

...