Ошибка при чтении и записи тестового файла в простом коде MPI - PullRequest
2 голосов
/ 30 сентября 2011

У меня есть код MPI, где процессы читают двоичный файл и записывают его снова. Способ распределения данных заключается в том, что процесс 0 читает (а затем записывает) первую половину файла, тогда как процесс 1 читает (а затем записывает) вторую половину файла. Проблема здесь сейчас заключается в том, что входные и выходные файлы не совпадают (diff показывает, что они различаются). Если есть только 1 процесс, все работает нормально. Может кто-нибудь указать, что идет не так?

Используя OpenMPI, скомпилированный как: mpicc -Wall test_mpi.c -o test_mpi
Запустите как: mpirun -np 2 ./test_mpi

Заранее спасибо.

#include <stdio.h>
#include <stdlib.h>
#include <mpi.h>

int main(int argc, char** argv) {

    int rank, np, i;  //np = no. of processes
    MPI_Init(&argc, &argv);
    MPI_Comm_rank(MPI_COMM_WORLD, &rank);
    MPI_Comm_size(MPI_COMM_WORLD, &np);

    int filesize = 48*1048576;  //input filesize 48MB

    double *data = (double*) malloc (filesize/np);
    FILE* fpa;
    fpa = fopen ( "512_featurevec.out", "rb");
    fseek(fpa, filesize/np*rank, SEEK_SET);
    printf("read: %d\n", (int)fread(&data[0], sizeof(double), filesize/(np*sizeof(double)), fpa));
    fclose(fpa);

    char* outfile = "outfile.txt";
    for(i=0; i<np; i++) {
        if(rank == i) {
            fpa = fopen ( outfile, "ab");
            fseek(fpa, filesize/np*rank, SEEK_SET);
            fwrite ( &data[0], sizeof(double), filesize/(np*sizeof(double)), fpa);
            fclose ( fpa );
        }   
    }   

    free(data);
    MPI_Finalize();
    exit(0);
}

Ответы [ 3 ]

3 голосов
/ 01 октября 2011

Если вы уже используете MPI и столкнетесь с проблемой поиска по разделу файла, вместо того, чтобы использовать POSIX, я бы предложил использовать MPI-IO (стандарт как часть MPI2, c. 1996 или около того): Хорошие ссылки:

и в нашем центре у нас есть первая часть этого, что я думаю, довольно хорошо:

Версия вашего кода с MPI-IO:

#include <stdio.h>
#include <stdlib.h>
#include <mpi.h>

int main(int argc, char** argv) {

    int rank, np;
    MPI_Init(&argc, &argv);
    MPI_Comm_rank(MPI_COMM_WORLD, &rank);
    MPI_Comm_size(MPI_COMM_WORLD, &np);

    const int filesize = 48*1048576;  //input filesize 48MB
    const int ndoubles = filesize/(sizeof(double)*np);
    double *localdata = malloc(ndoubles*sizeof(double));

    /* create a type which describes our view of the file --
     * in particular, just our subarray of the global array
     */
    int globalsizes[1] = {filesize};
    int localsizes[1] = {ndoubles};
    int starts[1] = {ndoubles*rank};

    MPI_Datatype fileview;
    MPI_Type_create_subarray(1, globalsizes, localsizes, starts, MPI_ORDER_C, MPI_DOUBLE, &fileview);
    MPI_Type_commit(&fileview);

    /* read in only our data */
    MPI_File fpa;
    MPI_Status status;
    MPI_File_open(MPI_COMM_WORLD, "512_featurevec.out", MPI_MODE_RDONLY, MPI_INFO_NULL, &fpa);

    /* note could use MPI_File_seek instead of file set view */
    MPI_File_set_view(fpa, (MPI_Offset)0, MPI_DOUBLE, fileview, "native", MPI_INFO_NULL);
    MPI_File_read_all(fpa, localdata, ndoubles, MPI_DOUBLE, &status);
    MPI_File_close(&fpa);

    /* write out data - it will have same layout, we're just writing instead of erading*/

    MPI_File_open(MPI_COMM_WORLD, "output.dat", MPI_MODE_WRONLY|MPI_MODE_CREATE, MPI_INFO_NULL, &fpa);

    /* note could use MPI_File_seek instead of file set view */
    MPI_File_set_view(fpa, (MPI_Offset)0, MPI_DOUBLE, fileview, "native", MPI_INFO_NULL);
    MPI_File_write_all(fpa, localdata, ndoubles, MPI_DOUBLE, &status);
    MPI_File_close(&fpa);

    free(localdata);
    MPI_Type_free(&fileview);
    MPI_Finalize();

    return 0;
}
3 голосов
/ 30 сентября 2011

Похоже, проблема связана с тем, что каждый дочерний элемент открывает файл для записи, что приводит к раздору.

Попробуйте, чтобы имя файла зависело от ранга (например, запись в out file.txt.(rank) и посмотрите, совпадают ли все выходные данные.

0 голосов
/ 30 сентября 2011

Отвечая на мой вопрос, но это работает:

char* outfile = "outfile.txt";
    for(i=0; i<np; i++) {
        if(rank == i) {
            fpa = fopen ( outfile, "ab");
            fseek(fpa, filesize/np*rank, SEEK_SET);
            fwrite ( &data[0], sizeof(double), filesize/(np*sizeof(double)), fpa);
            fclose ( fpa );
        } 
        MPI_Barrier(comm);  
    } 

По какой-то причине, если proc 1 прибывает перед proc 0 и fseeks пустой файл к некоторому значению, он делает позиционирует указатель файла на правильное смещение (проверено ftell), но записывает со смещения 0 только. (Должно быть, я делаю что-то тривиально неправильно, но в любом случае).

...