IBM Spectrum LSF - доступ к нескольким графическим процессорам на разных узлах HP C - PullRequest
0 голосов
/ 23 января 2020

Я пытаюсь использовать несколько графических процессоров: всего 8 графических процессоров, 4 графических устройства на узел, всего: 2 узла.

Пока что я получаю «недостаточно памяти»:

Я проверил частичный вывод кода тензорного потока, и используются только 4 устройства с графическим процессором.

Мой тензор потока Код - это учебник с измененным кодом, который использует функции тензорного потока с большим входным файлом (хорошо работает в интерактивной среде HP C с 2 графическими процессорами, использующими меньший файл). Код тензорного потока автоматически находит графические процессоры и распределяет их по задачам.

Как получить код задания или программный код python для поиска и использования всех 8 графических процессоров (из 2 узлов)?

HP C Персонал не может помочь мне с этим и сказал, что нужен сложный код. Последние два дня я потратил на поиски хорошего учебника и не смог его найти.

Любые полезные предложения приветствуются. Вот мой текущий сценарий:

#!/bin/bash
#BSUB -q gpu
#BSUB -J gpus_8
#BSUB -P acc_hpc
#BSUB -R v100
#BSUB -n 2
#BSUB -R "affinity[core(30)]"
#BSUB -R rusage[mem=326000,ngpus_excl_p=4]
#BSUB -W 05:00
#BSUB -o %J.stdout
#BSUB -eo %J.stderr
#BSUB -L /bin/bash

WRKDIR=/scratch/user
ml anaconda3
source activate environ1

python3 gpu_job.py

1 Ответ

0 голосов
/ 27 января 2020

Используйте #BSUB -R rusage[mem=326000,ngpus_excl_p=8] вместо. Требования к ресурсам, как правило, на работу. Смотрите также https://www.ibm.com/support/knowledgecenter/en/SSWRJV_10.1.0/lsf_resource_sharing/use_gpu_res_reqs.html.

...