Экономия тензорного кодера, декодера и внимания - PullRequest
0 голосов
/ 14 февраля 2019

Начните тренировку простого NMT (нейронного машинного переводчика) с вниманием, используя кодировщик и декодер, Обучение проходило на Colab,

encoder = Encoder(vocab_inp_size, embedding_dim, units, BATCH_SIZE)
decoder = Decoder(vocab_tar_size, embedding_dim, units, BATCH_SIZE)

Затем используйте контрольные точки для сохранения модели,

# On loacl machine dir changed to 'training_checkpoints/' to fit the loaction
checkpoint_dir = './training_checkpoints'
checkpoint_prefix = os.path.join(checkpoint_dir, "ckpt")
checkpoint = tf.train.Checkpoint(optimizer=optimizer,
                                 encoder=encoder,
                                 decoder=decoder)

И сохранять во время отслеживания с помощью

checkpoint.save(file_prefix = checkpoint_prefix)

После обучения контрольные точки восстановления работают нормально на Colab, и даже при сохранении всей папки контрольных точек на диске Google и восстановлении их снова, но при попытке восстановить их на моем локальном компьютереего результаты разные и мусор, Запустите контрольную точку перед тренировкой, используя

checkpoint.restore(tf.train.latest_checkpoint(checkpoint_dir))

Вывод записной книжки Colab:

Input: <start> يلعبون الكرة <end>
Predicted translation: he played soccer . <end> 

Вывод локальной машины:

Input: <start> يلعبون الكرة <end>
Predicted translation: take either either either either either either either either either either either either either either either either either either either either either either either either either either either either either either either either either either either either either either either either either

Версия Colab Tenorflow: 1.13.0-rc1

Версия tenorflow локального компьютера: 1.12.0

Как сохранить модель, не сталкиваясь с этой проблемой, зная, что эта проблема связана с различными версиями tenorflow?

Дополнительная ссылка для ноутбука NMT Нейронный машинный перевод с вниманием

1 Ответ

0 голосов
/ 16 февраля 2019

TF дает только гарантии прямой совместимости: https://www.tensorflow.org/guide/version_compat#compatibility_of_graphs_and_checkpoints Не удивительно, что 1.13 сохраняет файл, который 1.12 не может восстановить.Обновите тензор потока на вашей локальной машине?

...