После установки tennsflow-gpu не работает conda - PullRequest
0 голосов
/ 21 октября 2018

Я пытаюсь установить экземпляр виртуальной машины с GPU-поддержкой на GCE.Вот шаги, за которыми я следовал.Я ссылался на шаги из здесь и здесь .

1. Сборка виртуальной машины с Nvidia k80

2.Скачать Anaconda3

$ wget http://repo.continuum.io/archive/Anaconda3-4.0.0-Linux-x86_64.sh
$ bash Anaconda3-4.0.0-Linux-x86_64.sh
$ source ~/.bashrc

3.Установите CUDA Toolkit

$ curl -O https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/cuda-repo-ubuntu1604_9.0.176-1_amd64.deb
$ sudo dpkg -i cuda-repo-ubuntu1604_9.0.176-1_amd64.deb
$ sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/7fa2af80.pub 86_64/ 7fa2af80.pub
$ sudo apt-get update
$ sudo apt-get install -y cuda-9-0 -y 

4.Установите cuDNN

$ tar -xzvf cudnn-9.0-linux-x64-v7.1.tgz
$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

5. Установите переменные пути

$ echo 'export CUDA_HOME=/usr/local/cuda' >> ~/.bashrc
$ echo 'export PATH=$PATH:$CUDA_HOME/bin' >> ~/.bashrc
$ echo 'export LD_LIBRARY_PATH=/usr/local/cuda/extras/CUPTI/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
$ source ~/.bashrc

- вплоть до настоящего времени,Казалось, все работает нормально.

Затем я перешел на загрузку и установку tenorflow-gpu

6.Скачать Tenorflow-GPU

$ sudo apt-get install python3-dev python3-pip libcupti-dev
$ sudo pip install --upgrade tensorflow-gpu==1.4.0 

6-1. Первая ошибка и что я сделал, чтобы сделать эторабота.

Сначала я не смог pip install, потому что получил сообщение об ошибке:

Traceback (most recent call last):
  File "/usr/bin/pip", line 11, in <module>
    sys.exit(main())
  File "/usr/lib/python2.7/dist-packages/pip/__init__.py", line 215, in main
    locale.setlocale(locale.LC_ALL, '')
  File "/usr/lib/python2.7/locale.py", line 581, in setlocale
    return _setlocale(category, locale)
locale.Error: unsupported locale setting

Я нашел решение (?) здесь и выполнилследующее:

$ export LANGUAGE=en_US.UTF-8
$ export LANG=en_US.UTF-8
$ export LC_ALL=en_US.UTF-8
$ sudo locale-gen en_US.UTF-8
$ sudo dpkg-reconfigure locales

После этого я смог sudo pip install --upgrade tensorflow-gpu==1.4.0

6-2. Вторая ошибка и что я сделал, чтобы она заработала.

После загрузки я протестировал import tensorflow as tf в python3, но он выдал мне сообщение:

ImportError: Нет модуля с именем 'tenorflow'

После поиска ответовЯ наткнулся на этот пост и выполнил следующие команды.

$ cd /usr/local/cuda
$ sudo ln -s /usr/lib/x86_64-linux-gnu/ lib64
$ sudo ln -s /usr/include/ include
$ sudo ln -s /usr/bin/ bin
$ sudo ln -s /usr/lib/x86_64-linux-gnu/ nvvm
$ sudo mkdir -p extras/CUPTI
$ cd extras/CUPTI
$ sudo ln -s /usr/lib/x86_64-linux-gnu/ lib64
$ sudo ln -s /usr/include/ include

Затем я перезагрузил свой экземпляр.

Теперь мой tenorflow-gpu работает, но я думаю, что все, что я сделал выше, испортило Конду, потому что я больше не могу найти Конду.

При попытке сбросить путь Конды я выполнил

$ export PATH=/home/<USER_NAME>/anaconda3/bin:$PATH

Теперь я могу использовать команды conda (например, conda list), но не могу import tensorflow as tf.

Мне кажется, что когда я устанавливаю export PATH=/home/<USER_NAME>/anaconda3/bin:$PATH, я не могу import tensorflow as tf.Когда я исправляю проблему тензорного потока с 6-1 и 6-2, я не могу использовать команду conda list.Поэтому все, что я делаю, не делает их совместимыми ...

После прочтения многих постов и комментариев, я предполагаю (не уверен), что это связано с путями.Но я не могу понять, что могло вызвать проблему.Может быть, трудно напрямую решить мою проблему, не заглядывая в мою виртуальную машину, но может ли кто-нибудь добавить какую-либо идею, чтобы я мог проверить сам?

...