Вам придется сохранять контрольные точки через некоторый интервал.Если ваши эпохи выполняются быстро, вы можете сохранить модель после 5-10 эпох, в противном случае сохраните ее после каждой эпохи.И проверьте код, чтобы перечитать последнюю контрольную точку (основываясь на некоторых соглашениях об именах).Теперь какие проблемы с этим.
- Так как это Collaboratory и это бесплатно, они не дают вам выделенный экземпляр GPU, и поэтому он может отключиться в любое время, когда вы обновляете браузер /закрыть браузер / потерять подключение к Интернету и т. д.
- С этим уходит ваше временное хранилище.
- Плюс кооперирование дает вам ограниченный объем хранилища для ваших данных и модели.
Таким образом, вам необходимо сохранить контрольные точки в некотором «ПРОСТОЙ» хранилище.Сотрудничество поддерживает Google Drive.Вы можете проверить, как сохранить ваши файлы там.Также вам придется проверить, как читать оттуда.
Или, если вы ищете какую-то альтернативу.Спот-экземпляр AWS может быть разумным выбором (однако он оплачивается, и если вы можете получить некоторые студенческие кредиты откуда-то, вы можете использовать его).Отметим, что Colab - это тоже точечный экземпляр от Google.Вы также можете перейти на www.crestle.com, стоит 3 цента в час.