Я пытаюсь запустить тесты NAS-UPC на кластере из 32 узлов.
Он отлично работает в тех случаях, когда размер проблемы невелик.Когда я перехожу к большему размеру проблемы (КЛАСС D), я получаю эту ошибку (для теста MG)
*** Caught a fatal signal: SIGBUS(7) on node 2/32
p4_error: latest msg from perror: Bad file descriptor
*** Caught a signal: SIGPIPE(13) on node 0/32
p4_error: latest msg from perror: Bad file descriptor
p4_error: latest msg from perror: Bad file descriptor
*** FATAL ERROR: recursion failure in AMMPI_SPMDExit
*** Caught a signal: SIGPIPE(13) on node 27/32
*** Caught a signal: SIGPIPE(13) on node 20/32
*** Caught a signal: SIGPIPE(13) on node 21/32
p4_error: latest msg from perror: Bad file descriptor
*** FATAL ERROR: recursion failure in AMMPI_SPMDExit
*** FATAL ERROR: recursion failure in AMMPI_SPMDExit
*** FATAL ERROR: recursion failure in AMMPI_SPMDExit
*** Caught a signal: SIGPIPE(13) on node 16/32
*** FATAL ERROR: recursion failure in AMMPI_SPMDExit
Может кто-нибудь объяснить, почему это происходит, и если кто-то видел эту ошибку раньше и исправил ее?
РЕДАКТИРОВАТЬ: понял, что это проблема памяти.Но я не могу выделить нужное количество памяти для приложения во время компиляции