Как заблокировать оценщик от восстановления весов и глобальных шагов для каждой тренировки - PullRequest
0 голосов
/ 03 мая 2018

Я пытаюсь использовать API-интерфейс тензорного потока для разработки модели, и я обнаружил проблему на этапе обучения и визуализации:

Для той же model_fn () каждый раз, когда я пытаюсь вызвать метод estimator.train (), global_step будет увеличиваться по сравнению с шагами, которые я обучал в прошлый раз. например, если в последний раз запустить метод estimator.train () для перехода к global_step = 2000, то в этот раз, когда я начну обучать модель, она будет накапливаться, начиная с 2000, 2001, 2002 ...

Моя проблема: почему-то я хочу тренировать модель с нуля каждый раз. то есть мне не нужен оценщик для восстановления ранее обученных весов, когда я снова запускаю тренировку.

В настоящее время я просто вручную удаляю контрольные точки и файлы событий перед тем, как каждый раз запускать новое обучение, и это действительно неэффективно. Однако, несмотря на это, в последний раз все еще существуют остаточные кривые, которые я не могу удалить таким образом.

Как с этим справиться?

1 Ответ

0 голосов
/ 28 июня 2018
Опция

model_dir в оценщике - это то, где вы указываете путь для сохранения модели (контрольные точки и другие вещи). Поэтому каждый раз, когда вы начинаете тренировку, он просматривает этот путь и проверяет, есть ли какие-либо контрольные точки, и если это так, он выбирает последнюю контрольную точку и загружает веса в модель и начинает обучение, и поэтому каждый раз, когда контрольные точки увеличиваются.

Кажется, есть способ полностью прекратить сохранение контрольных точек, пожалуйста, посмотрите на эту ссылку .

В настоящее время я назначаю новое местоположение пути model_dir каждый раз, когда хочу начать новое обучение. Я проверю, существует ли путь, если нет, я создам эту папку.

...