Итак, я решил перейти на Ubuntu 20.04 с Windows 10, поскольку это лучшая среда, широко используемая в промышленности. Я столкнулся с некоторыми проблемами, когда клонировал свой чистый код Windows из Github. Я сразу же столкнулся с проблемами при попытке его запустить. Для контекста мой код использует Tensorflow 2.2.0 для сегментации изображений. Я тренируюсь с нуля с набором данных. Проблема возникает сразу же после запуска программы train.py. Первоначально произошла ошибка, которая была исправлена путем вставки следующих двух строк сразу после импорта Tensorflow (после проверки того, что Tensorflow может видеть и получать доступ к моему графическому процессору в Ubuntu)
gpus = tf.config.experimental.list_physical_devices('GPU')
tf.config.experimental.set_memory_growth(gpus[0], True)
После этого я получаю ошибки OOM, несмотря на то, что возможность запускать тот же код и набор данных на моей ОС Windows. Мне удалось запустить программу один раз, когда я изначально клонировал репо, но на следующий день я получил эти ошибки OOM и с тех пор сталкиваюсь с ними. Код по-прежнему работает на Windows. В следующем файле журнала показано, что у меня получилось, когда я запустил Ubuntu 20.04 на той же машине, на которой размещен мой Windows (у меня двойная загрузка). Я установил поддержку TF GPU точно так, как они указали для упомянутых версий. Единственное, что меня беспокоит, это то, что TF не имеет поддержки Ubuntu 20.04, что, как я предполагаю, может вызывать эту проблему, но как новый пользователь Ubuntu я не могу быть полностью уверен. Выходные данные Терминала и программы train.py приведены ниже.
https://drive.google.com/drive/folders/1GRkqCwwdnoPWzsPklq2NIS82P1bFfRr1?usp=sharing
Соответствующие характеристики: Графический процессор - NVIDIA 2070 Super Процессор - Ryzen 3600 Оперативная память - 32 ГБ Тензорфлоу - 2.2.0 Драйвер NVIDIA - 451.x CUDA - 10.1 cuDNN - 7.6.5
Есть ли у кого-нибудь представление о том, что может вызвать эту проблему?