Я пытаюсь использовать несколько графических процессоров: всего 8 графических процессоров, 4 графических устройства на узел, всего: 2 узла.
Пока что я получаю «недостаточно памяти»:
Я проверил частичный вывод кода тензорного потока, и используются только 4 устройства с графическим процессором.
Мой тензор потока Код - это учебник с измененным кодом, который использует функции тензорного потока с большим входным файлом (хорошо работает в интерактивной среде HP C с 2 графическими процессорами, использующими меньший файл). Код тензорного потока автоматически находит графические процессоры и распределяет их по задачам.
Как получить код задания или программный код python для поиска и использования всех 8 графических процессоров (из 2 узлов)?
HP C Персонал не может помочь мне с этим и сказал, что нужен сложный код. Последние два дня я потратил на поиски хорошего учебника и не смог его найти.
Любые полезные предложения приветствуются. Вот мой текущий сценарий:
#!/bin/bash
#BSUB -q gpu
#BSUB -J gpus_8
#BSUB -P acc_hpc
#BSUB -R v100
#BSUB -n 2
#BSUB -R "affinity[core(30)]"
#BSUB -R rusage[mem=326000,ngpus_excl_p=4]
#BSUB -W 05:00
#BSUB -o %J.stdout
#BSUB -eo %J.stderr
#BSUB -L /bin/bash
WRKDIR=/scratch/user
ml anaconda3
source activate environ1
python3 gpu_job.py