Доступ к EC2 в случае зависания экземпляра - PullRequest
0 голосов
/ 17 января 2020

Мой сайт работает на экземпляре t2.2xlarge (между ними нет ELB). Я могу S SH к этому экземпляру 99% времени, используя ключевой механизм.

Однако, когда веб-сайт не работает, иногда я не могу S SH к этому экземпляру, как все хотя состояние экземпляра RUNNING. В этих 1% случаях возвращается ошибка тайм-аута.

Нет изменений между способами, когда я могу подключиться к экземпляру, и когда у меня нет.

Метод подключения "EC2 Instance Connect (основанное на браузере соединение S SH), упомянутое на домашней странице AWS EC2, также никогда не помогало:

enter image description here

Пролистал все сообщения и ссылка ниже, но не повезло, поскольку S SH работал в 99% случаев:

Устранение неполадок при подключении к вашему экземпляру

Лучшая часть - "Проверка состояния системы", упомянутая в домашняя страница EC2 также показывает - Проверка доступности системы пройдена. На этот раз я отправил им отзыв об этой проблеме, но пока не получил ответ.

Обычно я жду несколько минут и затем перезагружаю экземпляр. Это худший вариант, но я не смог найти никакой альтернативы.

Пожалуйста, предложите, как найти root причину и устранить эту проблему.

Ответы [ 2 ]

0 голосов
/ 17 января 2020

Это сложный вопрос.

Если при возникновении проблемы ее можно восстановить только путем перезагрузки, то затрудняется ее отладка, поскольку вы не можете войти в систему, когда возникает проблема. Этот тип проблемы обычно вызывается программным обеспечением, запущенным на экземпляре, а не чем-то связанным с самим Amazon EC2.

Первое, что нужно проверить, будет Amazon CloudWatch Logs , чтобы увидеть, работает ли процессор на 100% при возникновении проблемы.

Следующее, что нужно проверить, - это файлы журналов на компьютере , которые вы можете просмотреть после перезагрузки. Вы можете настроить сценарий для непрерывной регистрации используемого процессора и процессов в файле журнала, чтобы их можно было изучить позже для определения основной причины.

См .:

0 голосов
/ 17 января 2020

Пожалуйста, закройте открытые соединения S SH и разрешите только заданные c диапазоны IP-адресов!.

Чтобы восстановить ваш экземпляр, вы можете запустить событие cloudwatch со ссылкой на эту ссылку Восстановление экземпляра

...