Мои тренировочные данные очень велики, что означает, что в каждой эпохе есть много тренировочных шагов. Я хочу использовать tf.keras.callbacks.ModelCheckpoint
для сохранения модели каждые 100,000
шагов и сохранять все эти модели на диске, а не переписывать файлы моделей при сохранении новой. Но я понятия не имею, как это сделать после прочтения документации. Похоже, что этот обратный вызов предназначен для сохранения модели к эпохе.
Итак, нужно ли реализовать пользовательский обратный вызов для сохранения модели по шагам?