Есть ли документ о том, как реализованы функции MPI, такие как MPI_Algather, MPI_AlltoAll, MPI_Allreduce и т. Д.?
Я хотел бы узнать об их алгоритме и вычислить их сложность с точки зрения однонаправленной или двунаправленной полосы пропускания и общего размера передачи данных для ряда узлов и фиксированного размера данных.