Вы упоминаете TF1 API Hub hub.Module
, поэтому я полагаю, что вы пишете код TF1 и используете совместимые с TF1 ресурсы хаба google / bert / ..., такие как https://tfhub.dev/google/bert_cased_L-12_H-768_A-12/1
Собираетесь ли вы провести отдельный прогон вашей программы для двух этапов обучения? Если это так, возможно, вы можете просто удалить trainable=True
из вызова hub.Module
во втором запуске. Это не влияет на имена переменных, поэтому вы можете восстановить результат обучения с первого запуска, включая скорректированные веса BERT. (Для ясности: предварительно обученные веса, поставляемые с концентратором. Модуль используется только для инициализации в самом начале обучения; восстановление контрольной точки отменяет их.)