У меня есть экземпляр aws ec2 p3.2xlarge. Я могу SSH и подключиться к нему легко. Однако примерно через 20 минут, пока я запускаю на нем модель keras, она сбрасывает соединение, и меня выгоняет с ошибкой Сброс соединения по порту 54.161.50.138 через порт 22 * 1002 *. Затем я могу восстановить соединение, но мне нужно начинать тренировать модель заново, потому что мой прогресс был потерян. Это происходит каждый раз, когда я подключаюсь к экземпляру. Есть идеи, почему это происходит?
Для SSH я использую gow, который позволяет мне запускать команды Linux на Windows - https://github.com/bmatzelle/gow/wiki
Я проверил свой публичный IP-адрес до и после сброса, и это было то же самое.
Я также посмотрел на использование процессора с помощью Amazon CloudWatch, и это было нормально - 20%.