Я тренируюсь с помощью nohup:
nohup python -u main.py &> output.txt &
Я преобразовал свой ipynb в python с помощью:
jupyter nbconvert --to script 'my-notebook.ipynb'
Когда я запускаю код в jupyter, он работает нормально. Когда я пытаюсь запустить сценарий python, я получаю RuntimeError CUDA initialization failed
. Я назначаю PCI_BUS_ID как для jupyter, так и для python:
try:
%env CUDA_DEVICE_ORDER=PCI_BUS_ID
%env CUDA_VISIBLE_DEVICES=5
except NameError:
os.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID"
os.environ["CUDA_VISIBLE_DEVICES"] = "5"
Я прошел 2 успешных тренировки. Я немного изменил модель, и теперь она не работает. Есть идеи?