Я пытаюсь получить тест UPC-NAS (скомпилированный для 256 потоков), работающий в кластере из 32 узлов. Когда я запускаю его, соединения rsh устанавливаются для 247 потоков, и он завершается, выдавая ошибку следующим образом
p0_11350: p4_error: Child process exited while making connection to remote process on dell16: 0
506 rm_l_237_24446: (26.785156) net_send: corm_11947: (215.339844) net_srm_l_1rm_24412: (26.785156) net_send: could not write to fd=4, errnrrrm_l_127_5013: (121.984375) net_send: could not w rite to fd=5, errno = 32
Кто-нибудь может указать, в чем проблема?
Отлично работает для небольших потоков, таких как 64, 128 и т. Д.