Tensorflow, Horovod и NVLINK NotFoundError - PullRequest
0 голосов
/ 09 марта 2019

Я пытаюсь запустить нейросеть с тензорным потоком, которая работает на графических процессорах, используя библиотеку horovod убера . В то же время я пытаюсь запустить сценарий измерения, который измеряет nvlinks между несколькими графическими процессорами. Увы, всякий раз, когда я запускаю файл, я получаю следующую ошибку:

tenorflow.python.framework.errors_impl.NotFoundError: /home/pat/.virtualenvs/venv/lib/python3.6/site-packages/horovod /tensorflow/mpi_lib.cpython-36m-x86_64-linux-gnu.so: неопределенный символ: _ZN10tensorflow14kernel_factory17OpKernelRegist rar12InitInternalEPKNS_9KernelDefEN4absl11string_viewESt10unique_ptory_Serf_0DF0F0S0FF

Кто-нибудь знает, как решить эту проблему?

Спасибо.

1 Ответ

0 голосов
/ 05 апреля 2019

Пожалуйста, посмотрите на этот вопрос, поднятый в репо:

https://github.com/horovod/horovod/issues/656

...