Ошибка импорта Tensorflow в экземпляре Amazon EC2 - PullRequest
0 голосов
/ 29 октября 2018

Я пытаюсь запустить сверточную нейронную сеть в моем экземпляре p3.16xlarge Amazon EC2. Я установил tenorflow и все остальные необходимые библиотеки для своей программы с помощью pip install, однако, когда я запускаю эту программу, я получаю сообщение об ошибке:

"ImportError: libcublas.so.9.0: невозможно открыть общий объектный файл: такого файла или каталога нет" "Не удалось загрузить собственную среду выполнения TensorFlow."

Это мои данные: Python 2.7.14 (по умолчанию, 2 мая 2018, 18:31:34) Amazon Linux AMI 2018.03.0.20180811 x86_64 HVM GP2

После изучения проблемы мне кажется, что мне нужна CUDA 9.0, в то время как большинство компьютеров с Linux используют CUDA 9.1. Как именно я могу понизить CUDA / изменить / настроить мой экземпляр так, чтобы тензорный поток работал? Я не знаю, как это сделать.

Спасибо

1 Ответ

0 голосов
/ 19 января 2019

Многие клиенты считают, что Deep Learning AMI - это самый простой способ запуска своих рабочих нагрузок в EC2. Он поставляется с предустановленными всеми популярными библиотеками.

https://aws.amazon.com/machine-learning/amis/

В качестве альтернативы, вы можете рассмотреть возможность использования Amazon SageMaker. Храните свои данные в S3, обучайте и развертывайте их в полностью управляемой инфраструктуре. Это гораздо проще, чем управлять своими собственными экземплярами EC2:)

https://aws.amazon.com/sagemaker/

Мне бы очень хотелось услышать ваши отзывы и ответить на любые вопросы.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...