Глубокое обучение в AWS с 200 ГБ данных на экземпляре EC2 - сбой подключения ноутбука Jupyter - PullRequest
0 голосов
/ 08 октября 2018

Я использую алгоритм обучения переноса (ResNet-50) для определенного набора данных в экземпляре AWS EC2.В частности, я использую стандартные AMI сообщества Amazon для углубленного изучения на вычислительном экземпляре с графическим процессором p3.8xlarge.

Когда я запускаю ssh в своем экземпляре, я активирую среду глубокого обучения conda.Оттуда я запускаю ноутбуки jupyter для запуска кода в ядре python 3.

Когда я впервые запускаю свой код, он работает нормально.Ниже приведена загрузка ЦП%:

В какой-то момент в коде соединение с ноутбуком не устанавливается.Это единственная информация, которую я получаю от терминала:

packet_write_wait: соединение с XXXX IP-адресом, порт 22: разорванный канал

Как это исправить?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...