Я использую SageMaker для обучения некоторой пользовательской модели TF, которую я понял.Во время тренировки я, естественно, оцениваю модель несколько раз, чтобы понять, когда NN действительно начинает переоснащениеПосле обучения я хотел бы восстановить модель, которая работает лучше всего (т.е. с минимальными потерями при проверке), и развернуть ее на конечной точке.Однако, если я использую классический Tensorflow.attach (), восстанавливаемая модель соответствует модели, сохраненной в output / model.tar.gz, которая, если я правильно понял, будет той, которая соответствует последней итерации обучения (таким образом, это может налагаться).
Есть ли способ указать SageMaker, какую контрольную точку восстанавливать, не обязательно переобучая модель с ранней остановкой?Даже вынудив SM сохранить в model.tar.gz модель, которая представляет минимальные потери при проверке и не последнюю, будет работать для меня, к сожалению, я не нашел немедленного способа сделать это ...
Спасибовы!