Я пытаюсь запустить многослойный код Chapel в кластере с сетью MXM Infiniband (40 Гбит / с, модель: Mellanox Technologies MT26428).
Я следовал как документации Chapel, так и GASNet, и установил
export CHPL_COMM_SUBSTRATE=ibv
export CHPL_LAUNCHER=gasnetrun_ibv
export GASNET_IBV_SPAWNER=mpi
вместо использования CHPL_COMM_SUBSTRATE=mxm
, как только mxm устареет.
Проблема в том, что я могу построить Часовню, используя подложку ibv.Но я не могу работать в нескольких локалях.Я получаю огромное количество ошибок тайм-аута.
Во-первых, я думал, что проблема в PKEY.Итак, я добавил "--mca btl_openib_pkey "0x8100""
к MPIRUN_CMD
.Но безуспешно.
Я также пытался использовать устаревшую конфигурацию mxm:
CHPL_LAUNCHER=gasnetrun_mxm
export CHPL_LAUNCHER=gasnetrun_ibv
export GASNET_MXM_SPAWNER=mpi
Однако я не могу построить часовню с такой конфигурацией.Это сообщение об ошибке:
"User requested --enable-mxm, but I don't know how to build mxm programs for your system."
Кстати, использование GASNET поверх MPI, UDP и Infiniband без ключа разделения работает просто отлично.
Кто-нибудь знает, как использовать Chapel в кластере, оборудованном сетью MXM Infiniband и ключом раздела (PKEY)?
С наилучшими пожеланиями,
Tiago Carneiro.