nv-nsight-cu-cli вызвал сбой Tensorflow - PullRequest
       119

nv-nsight-cu-cli вызвал сбой Tensorflow

0 голосов
/ 09 октября 2018

Я скачал новейший инструмент профилирования Nsight Compute и хочу использовать его для тестирования приложений Tensorflow.Код, который я использую: здесь .Он отлично работает, когда я его выполняю, и когда я сравниваю его с nvprof ./mnist.py, у него не было никаких проблем.Однако, когда я пытаюсь запустить его с помощью команды sudo ./nv-nsight-cu-cli [path to the file], я получаю следующую ошибку:

ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory

Я подозреваю, что nv-nsight-cu-cli каким-то образом вообще не распознал переменную среды,Есть ли какое-то исправление вокруг?

Ответы [ 2 ]

0 голосов
/ 01 мая 2019

Похоже, что GP100 в данный момент не поддерживается инструментом.Ответ найден здесь :

Nsight Compute поддерживает только Pascal (кроме GP100) и более поздние графические процессоры.

0 голосов
/ 01 мая 2019

Вам необходимо искать различия в обеих средах:

  • переменные env
  • LD_LIBRARY_PATH
  • /etc/ld.so.conf
  • /etc/ld.so.conf.d/*
  • cuBLAS
    • Установка завершена / не нарушена?
    • Установлена ​​ли она в одном месте на обеих машинах?
    • Версии
  • ...

Вы можете начать с locate libcublas.so на обеих машинах, чтобы увидеть, есть ли разница.Кроме того, вы можете strace -f -e open, чтобы программа проверила, откуда она пытается libcublas.so.

Ваша ошибка (на данный момент) не имеет никакого отношения к графическим процессорам: libcublas.so.9.0 просто невозможно найти.Найдите его, найдите, почему Tensorflow не может его найти, и ваша проблема будет решена.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...