Керас в Google Colab Laboratory: неполные итерации? - PullRequest
0 голосов
/ 09 мая 2018

Я использую keras добавление Пример rnn (seq2seq) - здесь .Я попытался запустить это на 1. Jupyter на Ubuntu VM, а также на ноутбуке Google colab Laboratory с графическим процессором.Но я боюсь в Google Colab, он не завершает все итерации.Если быть более точным,

Ниже приведены журналы из обычной записной книжки Jupyter:

Iteration 1
Train on 45000 samples, validate on 5000 samples
Epoch 1/1
45000/45000 [==============================] - 75s 2ms/step - loss: 1.8899 - acc: 0.3209 - val_loss: 1.7819 - val_acc: 0.3429

Ниже приведены журналы из записной книжки Google.

Iteration 1
Train on 45000 samples, validate on 5000 samples
Epoch 1/1
17536/45000 [==========>...................] - ETA: 10s - loss: 2.0067 - acc: 0.2934

Обратите внимание, что после этого незавершенногоитерация, она не остановится, а перейдет к следующей итерации.Ниже приведены журналы следующей итерации на ноутбуке colab -

Iteration 2
Train on 45000 samples, validate on 5000 samples
Epoch 1/1
34688/45000 [======================>.......] - ETA: 2s - loss: 1.7466 - acc: 0.3562

Обратите внимание, что я использую один и тот же код в обеих этих средах.Я не понимаю, что здесь происходит.Почему итерации не завершены на ноутбуке Google colab?Это связано с графическими процессорами в Google colab?Как это исправить?Любые указатели будут оценены.Спасибо!

1 Ответ

0 голосов
/ 05 сентября 2018

Я сталкивался с этой проблемой в Co-Lab, предоставляющей ограниченную память (до 12 ГБ) в облаке, что создает много проблем при решении проблемы. Вот почему только 300 изображений используются для обучения и тестирования. Когда изображения были предварительно обработаны с размером 600x600 и размер пакета был установлен равным 128, модель Keras зависла в эпоху 1. Компилятор не показывал эту ошибку. На самом деле ошибка была ограничена во время выполнения, которая была не может обрабатывать CoLab, потому что он дал только 12 ГБ ограниченной памяти для использования. Решение вышеупомянутой проблемы было решено путем изменения размера пакета до 4 и уменьшения размера изображения до 300x300, потому что с 600x600 это все еще не работает. И, наконец, Рекомендовать решение: сделать размеры изображений и Batch_size малыми, пока не получите ошибку Запускайте снова и снова, дополнительно изменяя размер пакета и размер изображения маленькими до тех пор, пока во время выполнения не останется ошибочный сильный текст

...