Я использую mpi4py и MPICH (установленный с conda) для распараллеливания обучения системы обучения подкреплению на нескольких процессорах (используя экземпляр AWS EC2, а именно c5.x12) с Ubuntu. Я оценил производительность, и количество тренировок за единицу времени увеличивается на 30% (при использовании 5 процессов) по сравнению с тренировкой с одним процессом. Однако, когда я использую 5 процессов на своем локальном компьютере, я получаю увеличение количества тренировок за единицу времени на 300% по сравнению с тренировкой с одним процессом.
На моем компьютере я использую Windows и Microsoft MPI, который, я думаю, основан на MPICH, так что может вызвать эту разницу в производительности? Как я могу получить лучшее от AWS?