проблема при отправке нескольких неблокирующих сообщений с помощью MPI_Isend и получении с помощью MPI_Recv в C - PullRequest
0 голосов
/ 17 января 2020

Я кодирую параллельный алгоритм, и у меня проблема с неблокируемой связью. Я моделирую свою проблему следующим кодом:

int main( int argc, char* argv[] ) {
    MPI_Init(&argc, &argv);
    int rank, p;
    MPI_Comm_rank( MPI_COMM_WORLD, &rank );
    MPI_Comm_size( MPI_COMM_WORLD, &p );

    int a,b, i, j;
    int maxNumber = 8192;

    int(*tab)[maxNumber] = malloc(sizeof(int[maxNumber + 1][maxNumber + 1]));
    MPI_Request* r = malloc(sizeof * r);

    if(rank == 0){
        for(i = 0; i < maxNumber + 1; i++){
            for(j = 0; j < maxNumber + 1; j++){
                tab[i][j] = 2*i+i*j;
            }
            for(a = 1; a < p; a++){
                MPI_Isend(&tab[i], maxNumber + 1, MPI_INT, a, i, MPI_COMM_WORLD, r);
                printf("Process 0 send the block %d to process %d\n", i, a);
            }
        }

    }
    else{
        for(i = 1; i < p; i++){
            if(rank == i){
                for(j = 0; j < maxNumber + 1; j++){
                    printf("Process %d wait the block %d to process 0\n", i, j);
                    MPI_Recv(&tab[j], maxNumber + 1, MPI_INT, 0, j, MPI_COMM_WORLD, MPI_STATUS_IGNORE);
                    printf("Process %d receive the block %d to process 0\n", i, j);
                }
            }           

        }
    }

    MPI_Finalize();

    return 0;
}

Процессор 0 отправляет каждую строку матрицы размера 8192 * 8192 другим процессорам после некоторых вычислений. Проблема в том, что процессор 0 заканчивает отправку 8192 строк до того, как эти процессоры получили данные.

Это одна часть вывода:

...
...
Process 0 send the block 8187 to process 1
Process 0 send the block 8188 to process 1
Process 0 send the block 8189 to process 1
Process 0 send the block 8190 to process 1
Process 0 send the block 8191 to process 1
Process 0 send the block 8192 to process 1
Process 1 receive the block 5 to process 0
Process 1 wait the block 6 to process 0
Process 1 receive the block 6 to process 0
Process 1 wait the block 7 to process 0
Process 1 receive the block 7 to process 0
Process 1 wait the block 8 to process 0
Process 1 receive the block 8 to process 0
Process 1 wait the block 9 to process 0
Process 1 receive the block 9 to process 0
...
...

PS: связь должна быть не блокировка для отправки, потому что в моей задаче процесс 0 выполняет вычисления в O (n² / p²) на каждой итерации перед отправкой его другим процессорам, чтобы они начали свои вычисления как можно скорее.

Пожалуйста Вы знаете, что я могу сделать для решения этой проблемы?

1 Ответ

0 голосов
/ 19 января 2020

Спасибо @Gilles за ваши ответы. Это позволяет мне решить мою проблему. Мне нужно было использовать MPI_Ibsend для выделения необходимого объема буферного пространства, в которое можно копировать данные, пока они не будут доставлены.

int main( int argc, char* argv[] ) {   
    MPI_Init(&argc, &argv);
    int rank, p;
    MPI_Comm_rank( MPI_COMM_WORLD, &rank );
    MPI_Comm_size( MPI_COMM_WORLD, &p );

    int a, i, j;
    int maxNumber = atoi(argv[1]);

    int(*tab)[maxNumber] = malloc(sizeof(int[maxNumber + 1][maxNumber + 1]));
    MPI_Request* tabReq = malloc(maxNumber * sizeof * tabReq);

    int bufsize = maxNumber * maxNumber; 
    char *buf = malloc( bufsize ); 

    if(rank == 0){
        for(i = 0; i < maxNumber + 1; i++){
            for(j = 0; j < maxNumber + 1; j++){
                tab[i][j] = 2*i+i*j;
            }
            for(a = 1; a < p; a++){
                MPI_Buffer_attach( buf, bufsize );
                MPI_Ibsend(&tab[i], maxNumber + 1, MPI_INT, a, i, MPI_COMM_WORLD, &tabReq[i]);
                MPI_Buffer_detach( &buf, &bufsize );
                printf("Process 0 send the block %d to process %d\n", i, a);
            }
        }
    }
    else{
        for(j = 0; j < maxNumber + 1; j++){
            printf("Process %d wait the block %d to process 0\n", rank, j);
            MPI_Recv(&tab[j], maxNumber + 1, MPI_INT, 0, j, MPI_COMM_WORLD, MPI_STATUS_IGNORE);
            printf("Process %d receive the block %d to process 0\n", rank, j);
        }
    }

    MPI_Finalize();

    return 0;
}

Это одна часть вывода:

...
...
Process 1 wait the block 8186 to process 0
Process 0 send the block 8185 to process 1
Process 1 receive the block 8186 to process 0
Process 1 wait the block 8187 to process 0
Process 0 send the block 8186 to process 1
Process 1 receive the block 8187 to process 0
Process 1 wait the block 8188 to process 0
Process 0 send the block 8187 to process 1
Process 1 receive the block 8188 to process 0
Process 1 wait the block 8189 to process 0
Process 0 send the block 8188 to process 1
Process 1 receive the block 8189 to process 0
Process 1 wait the block 8190 to process 0
Process 0 send the block 8189 to process 1
Process 1 receive the block 8190 to process 0
Process 1 wait the block 8191 to process 0
Process 0 send the block 8190 to process 1
Process 1 receive the block 8191 to process 0
Process 1 wait the block 8192 to process 0
Process 0 send the block 8191 to process 1
Process 1 receive the block 8192 to process 0
Process 0 send the block 8192 to process 1
...