Я использую Amazon SageMaker для обучения модели с большим количеством данных.Это занимает много времени - часы или даже дни.В течение этого времени я хотел бы иметь возможность запросить у тренера и увидеть его текущее состояние, в частности:
- Сколько итераций он уже сделал, и сколько итераций ему еще нужно сделать?(алгоритм обучения - глубокое обучение - он основан на итерациях).
- Сколько времени нужно для завершения обучения?
- В идеале, я хотел бы классифицировать тестовый образец, используямодель текущей итерации, чтобы увидеть ее текущую производительность.
Одним из способов сделать это является явное указание тренеру распечатывать отладочные сообщения после каждой итерации.Однако эти сообщения будут доступны только на той консоли, с которой я запускаю трейнер.Поскольку обучение занимает так много времени, я хотел бы иметь возможность запрашивать статус тренера удаленно, с разных компьютеров.
Есть ли способ удаленного запроса статуса работающего тренера?