MPI_Op_create: функция-кандидат недопустима. Пользовательский указатель структуры не может быть интерпретирован как пустой указатель - PullRequest
0 голосов
/ 21 апреля 2019

Я пытаюсь использовать MPI_Op_create() для создания собственного сокращения, чтобы я мог передать пользовательский тип структуры для функции MPI_Allreduce().См. Ссылку для примера: http://www.netlib.org/utk/papers/mpi-book/node118.html

У определения, которое я определяю, есть подпись:

void reduction_op(data_t *in, data_t *inout, int *len, MPI_Datatype * datatype)

Где data_t - это имя моей пользовательской структуры.Если я передаю uration_op MPI_OP_create(), я получаю следующую ошибку компилятора:

kmeans_short.cpp:60:5: error: no matching function for call to 'MPI_Op_create'
    MPI_Op_create(reduction_op, 1, &reduc_op);
    ^~~~~~~~~~~~~
/usr/local/include/mpi.h:1051:5: note: candidate function not viable: no known conversion from
      'void (data_t *, data_t *, int *, MPI_Datatype *)' (aka 'void (data *, data *, int *, int
      *)') to 'MPI_User_function *' (aka 'void (*)(void *, void *, int *, int *)') for 1st
      argument
int MPI_Op_create(MPI_User_function *user_fn, int commute, MPI_Op *op) MPICH_API_PUBLIC;
    ^
1 error generated.
make: *** [kmeans] Error 1

См. Ниже пример игрушки.Я компилирую с mpicxx (я также попробовал mpicc и mpic ++ и получил ту же ошибку).Любая помощь в устранении вышеупомянутой ошибки компиляции будет высоко ценится!

#include <iostream>
#include <stdlib.h>
#include <mpi.h>
#include <unistd.h>
#include <float.h>
#define N_DATA 1493

using namespace std;


#define FEATURES 8
typedef struct data{//Custom data structure for reduce operation
    float feat[FEATURES];
    long cluster;
} data_t;


void reduction_op(data_t *in, data_t *inout, int *len, MPI_Datatype * datatype){
    data_t temp;
    for(int i=0; i< *len; i++){
        temp.cluster = in->cluster + inout->cluster;
        for(int j=0; j<FEATURES; j++)
            temp.feat[j] = in->feat[j] + inout->feat[j];
        *inout = temp;
        in++;
        inout++;
    }    
}


int main(int argc, char * argv[]){

    MPI_Init(&argc, &argv);
    int n_data = 1493;

    int world_size;
    MPI_Comm_size(MPI_COMM_WORLD, &world_size);

    int p_data = n_data/world_size; /*length of data per process*/ 
    int world_rank;
    MPI_Comm_rank(MPI_COMM_WORLD, &world_rank);

    data_t data; data.feat[0] = 0.0; data.cluster = 0;

    //mpi type for data_t
    MPI_Datatype MPI_data_t;
    int structlen = 2;
    int blocklength[structlen];
    MPI_Datatype type[structlen];
    MPI_Aint displacement[structlen];
    blocklength[0] = FEATURES; type[0] = MPI_FLOAT;
    displacement[0] = (size_t)&(data.feat)-(size_t)&data;
    blocklength[1] = 1; type[1] = MPI_LONG;
    displacement[1] = (size_t)&(data.cluster) - (size_t)&data;
    MPI_Type_create_struct(structlen, blocklength, displacement, type, &MPI_data_t);
    MPI_Type_commit(&MPI_data_t);

    //CUSTOM REDUCE FUNCTION FOR ALLREDUCE WITH MPI_data_t
    MPI_Op reduc_op;
    MPI_Op_create(reduction_op, 1, &reduc_op); //ERROR OCCURS HERE


    MPI_Type_free(&MPI_data_t);
    MPI_Finalize();


    return 0;
}

1 Ответ

2 голосов
/ 22 апреля 2019

Вы должны изменить объявление вашей функции reduce_op на

void reduction_op(void *in, void *inout, int *len, int* datatype)

, а затем преобразовать void* in и void* inout в data_t.По сути, ваше определение reduction_op должно явно следовать определению MPI_User_function.

...